Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

微胖编译

除了人类,有些声音也在偷偷和语音助手说话

除了人类本身,还有些声音也在偷偷和这些智能设备说话!

据纽约时报报道,本月,伯克利的一些研究人员发表了一篇研究论文,他们进一步说明他们可以将命令直接将命令嵌入到音乐或者对话文本中。

也就是说,当一个人类听到有人在说话或者有交响乐团在演奏时,Amazon 的 Echo 智能音箱可能会听到一个指令并在你的购物车中加入一些东西。

最近,伯克利研究人员已经通过开源的 Mozilla 的 DeepSpeech「语音-文本」转换软件将命令整合到了语音识别中。

它们可以将命令「嘿,Google,浏览『evil.com』」隐藏到录音中。

而伯克利的研究组也将命令嵌入到了音乐文件中,包括从 Verdi 的「安魂曲」中剪辑出的 4 秒钟的片段。

尽管人工智能正在取得巨大的进步,它仍有可能被欺骗和操纵。

利用像素愚弄计算机视觉已经不是新闻,在路标上贴上小贴纸来迷惑计算机视觉系统,使自动驾驶汽车转向或者加速也见诸于报端。

如今,通过音频攻击,研究者们正在利用人类和机器语音识别之间的差别。

文章写到,「语音识别系统通常将每个声音转译成一个字母,最终将其编译成单词或者短语。通过对音频文件进行细微的改动,研究人员能够删除掉语音识别系统本应该听到的声音,并且将其替换为另一种声音,这种声音将被机器转录为不同的内容,而这种声音是人耳几乎听不见的。」

其实早在 2016 年,加州大学伯克利分校和乔治城大学的一群学生就展示了他们可以将命令隐藏在通过扬声器或者 YouTube 视频播放白噪声中,让智能设备可以打开飞行模式或者打开一个网站。

而在去年,来自于普林斯顿大学和中国浙江大学的研究人员证明,语音识别系统可以通过人耳听不到的频率来激活。这种攻击首先将手机的声音和震动调弱,这样主人就不会听到系统的反应。

这项技术被中国的研究人员称为「Dolphin Attack」,它可以命令智能设备访问恶意网站。

面对这种威胁,设备制造商的反应各不相同,尤其是当它们考虑到平衡安全和易用性时。

据文章透露,对比,Amazon 表示,它们还没有将具体的安全措施披露出来,但是它们确实已经采取了相关的措施来确保 Echo 智能音箱的安全。而谷歌 Google Assistant 具有规避无法探测的音频命令的功能。

这两家公司的智能助手都采用了更高级的语音识别技术,除非它们识别出了用户的声音,否则这些设备不会执行特定的命令。

Apple 公司则表示,其智能音箱 HomePod 在设计过程中已经考虑到了防止类似于打开门锁这样的命令。

其他防护措施还有:在 Siri 执行涉及到敏感数据或者打开应用和网站的命令之前,Iphone 和 Ipad 需要被解锁。

然而,很多人的智能手机并没有上锁,而且至少在目前,语音识别系统是众所周知的容易被欺骗。不过,研究人员仍希望面对各种攻击安全隐患,公司乃至其他人会说,

『好吧,既然这种攻击是可能的,那就让我们试着修复它 吧!』」。

产业语音识别语音助手
相关数据
自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

自动驾驶汽车技术

自动驾驶汽车,又称为无人驾驶汽车、电脑驾驶汽车或轮式移动机器人,是自动化载具的一种,具有传统汽车的运输能力。作为自动化载具,自动驾驶汽车不需要人为操作即能感测其环境及导航。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

暂无评论
暂无评论~