在前一篇文章中,我们展示了如何借助 SOTA 项目探索机器翻译最前沿的进展。我们可以发现,拥有最顶尖效果的模型,通常都有非常美妙的想法,这对于理解整个任务或领域非常重要。但是如果从另一个角度,探讨这些顶尖模型的关系与演化,我们能获得另一种全局体验。
为了获得这种全局概览,我们探索了 SOTA 项目中图像生成领域的顶级模型。根据机器之心的 SOTA 模型统计,在图像生成领域 58 个顶尖模型中,有 32 个模型在命名中带了「GAN」。这还是包含了生成对抗网络、变分自编码器和流模型三大生成模式的结果。
由此可见,GAN 最近两年构建的变体非常多,我们难以理清它的发展主线。为此,通过 SOTA 项目理解 GAN 的发展全景,也不失为一个好方法。
图像生成 SOTA 排名:https://www.jiqizhixin.com/sota/tech-task/3070d792-9832-48aa-bb1c-3b899fc3c100
因为图像生成领域的 SOTA 排名涉及非常多的数据集与度量方法,我们并不能直观展示不同 GAN 的发展路线。但是通过统计最主流的一些解决方案,我们还是能从模型架构与损失函数两方面介绍 GAN 的发展。
图注:模型由浅到深、机制由简单到复杂、图片质量由低到高的发展过程,其中 SinGAN 获得了 ICCV 2019 最佳论文。图片改编自 arXiv:1906.01529。
图注:不同生成对抗网络所采用的损失函数,它们针对 GAN 的不同缺点提出了自己的解决方案。