谷歌大脑提出语音识别对抗样本
对抗样本是由对手设计的机器学习模型输入,目的是导致错误输出。到目前为止,对抗样本在图像领域中的研究最为广泛。在图像领域中,对抗样本可以通过图像的细微修改来构建,进而导致误分类,并且对抗样本在现实世界很实用。相比之下,目前应用于语音识别系统的针对性对抗样本不具有这两种特性:人类很容易识别对抗扰动,而且这些扰动在无线播放下就会失去作用。本论文《Imperceptible, Robust, and Targeted Adversarial Examples for Automatic Speech Recognition》在这两方面均取得了进展。其一,研究人员利用听觉掩蔽的心理声学原理开发出了不可察觉的音频对抗样本(已经人类研究证实),同时保持任意完整句100%的针对性成功率。其二,通过构建在应用真实模拟环境失真后依然有效的扰动,研究人员在物理世界无线音频对抗样本方面取得进展。