MIT最新研究 : 对抗样本不是bug,而是特征
对抗样本在机器学习领域受到广泛关注,但它们存在和流行的原因却并不明晰。来自 MIT 的一篇最新研究论文《Adversarial Examples Are Not Bugs, They Are Features》表明,对抗样本的产生可直接归因于非稳健特征的出现:某些来自数据分布模式的特征具备高度预测性,但对于人类来讲是脆弱且难以理解的。研究者构建了一个理论框架,并在其中捕捉这些特征,从而在标准数据集中建立了它们的广泛存在。最终,研究者展示了一个严格的任务设置,在该设置中研究者将实践中观察到的对抗样本现象,与(人类设定的)稳健性概念和数据内部几何之间的不匹配性严格地联系起来。