Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

CVPR 2020线上分享 | 北航GAN变妆应用:生成模型架构的对抗性搜索方法

作为计算机视觉领域的三大国际顶会之一,CVPR 每年都会吸引全球领域众多专业人士参与。如 2019 年,CVPR 注册参会人数高达 9227 人,突破历届记录。其中,来自国内的参会人数就达到 1044 位,仅次于大会举办地美国(4743 位)。

CVPR 2020 原定于 6 月 16 日至 20 日在华盛顿州西雅图的华盛顿州会议中心举行,但是当前全球疫情势态严峻,越来越多的国际 AI 顶会开始转向线上,CVPR 也不例外。

虽然无法去现场交流,但这无法阻挡我们学习的热情。

为向读者们分享更多 CVPR 优质内容,在 CVPR 2020 开幕之前,机器之心将策划多期线上分享。这是机器之心 CVPR 2020 线上分享的第五期,我们邀请到北航刘偲副教授指导的两位同学分享他们关于 GAN 的研究。


分享主题一:PSGAN: 对姿态和表情变化鲁棒的可定制化妆容迁移

个人介绍:姜文韬,北京航空航天大学计算机学院硕士一年级在读,导师为刘偲副教授,目前的主要研究方向为深度生成模型。
 
分享概要:妆容迁移,即将带妆图片的妆容迁移到素颜图片上,是一个被广泛研究且具有实用价值的方向。然而原有的工作仅能在带妆和素颜图片的头部姿态和脸部表情一致的情况下才能正常迁移。除此之外,也无法指定换某个部位的妆容和控制各个部位妆容的浓淡。

针对上述缺点,我们和依图科技合作提出的 PSGAN 将带妆图片的妆容提取为两个妆容矩阵,通过计算带妆和素颜图片像素之间的相似性从而进行对姿态和表情变化鲁棒的妆容迁移。同时,通过对妆容矩阵的一些操作,还可实现对妆容迁移的高度可定制化。最后,本文还采集了一个含有各种表情和姿态的人脸数据集用以评定效果。

本文已被 CVPR 2020 录用为 Oral Presentation。

  • 论文链接:https://arxiv.org/abs/1909.06956

  • Github 链接:https://github.com/wtjiang98/PSGAN


分享主题二:如何高效搜索深度生成模型的网络架构
 
个人介绍:高晨,中国科学院大学硕士二年级在读,研究兴趣主要包括机器感知与决策、对抗式生成模型、AutoML。在 CCF-A 类会议发表论文数篇,目前主要研究方向为机器感知与决策。

分享概要

Image Generation 是计算机视觉领域的一个基础问题。近些年 GANs 在图像生成的各个子问题上取得了持续显著的进展。然而现有的生成模型架构的设计,严重依赖于专家经验和 trial-and-error,并且 GAN 模型在训练层面的不稳定性也极大地增加了模型架构设计的难度。同时在诸如图像分类,分割等判别类任务上,针对性的网络结构设计可以有效地提升模型的性能已被充分证实(如 ResNet, HRNet, DPN, OctConv)。然而至今关于生成模型骨干网络结构设计的研究还很少,并且网络结构种类十分有限,关于网络结构对生成模型性能的影响也少有被研究。

本次和大家分享的是我们与依图研究中心合作的 CVPR 2020 工作,我们针对 GANs 提出了一种对抗性神经网络架构搜索算法(AdversarialNAS),来更加高效地搜索更优的生成模型架构,是图像生成任务下首个 Gradient-based NAS 方法,克服了生成模型搜索设定下特有的一些难点。同时我们也为 GANs 领域设计了一个大型的搜索空间,也为未来的研究带来了一些启发。实验结果表明,我们的方法以更快的搜索速度得到了更优的生成模型结构,网络结构在 Transferability 和 Scalability 层面上都展现出了更优的性能。欢迎大家一同交流。
 
  • 论文链接:https://arxiv.org/pdf/1912.02037.pdf

  • GitHub 链接:https://github.com/chengaopro/AdversarialNAS


分享时间:北京时间 5 月 27 日 20:00-21:00

CVPR 2020 机器之心线上分享

在 CVPR 2020 收录的大量优秀论文中,我们将选出数篇优质论文,邀请论文作者来做线上分享。整场分享包括两个部分:论文解读和互动答疑。

线上分享将在「CVPR 2020 交流群」中进行,加群方式:添加机器之心小助手(syncedai6),备注「CVPR」,邀请入群。入群后将会公布直播链接。
 
小助手二维码

理论CVPR 2020机器之心生成模型GAN
暂无评论
暂无评论~