麻省理工学院新研究:生成对抗性网络的「可稳定性」
现代机器学习的一个公开秘密是,许多模型在标准基准上都能很好地工作,但无法在实验室外推广。这归因于有偏见的训练数据,这些数据对现实世界的事件报道不足。生成模型也不例外,但是生成对抗网络(GANs)的最新进展则相反:这些模型现在可以合成惊人逼真的多样图像。照片的生成模型解决了吗?麻省理工学院的新研究「生成对抗性网络的「可稳定性」」表明,尽管当前的 GAN 可以很好地适合标准数据集,但它们仍不足以作为视觉流形的全面模型。研究人员研究了它们适应简单变换(例如相机移动和颜色变化)的能力。研究人员发现这些模型反映了对其进行训练的数据集(例如居中对象)的偏差,但是它们还具有一定的泛化能力:通过在潜在空间中进行「导向」,研究人员能够在改变分布的同时仍然创建逼真的图像。研究团队假设分布偏移的程度与训练数据分布的广度有关,并进行了实验以量化 GAN 转换的极限,介绍了缓解该问题的技术。