Alexa和Siri可以听到这个隐藏的命令。你不能。

2018-05-14

许多人习惯于与他们的智能设备交谈,要求他们阅读文本,播放歌曲或设置闹钟。但是别人也可能会偷偷地跟他们说话。

在过去的两年中,中国和美国的研究人员已经开始展示他们可以向苹果的Siri,亚马逊的Alexa和谷歌的助手发送人耳无法察觉的隐藏命令。

在大学实验室内,研究人员已经能够秘密激活智能手机和智能扬声器上的人工智能系统,使他们拨打电话号码或打开网站。在错误的手中,这项技术可以用来解锁门,电汇或在线购买东西 - 只需通过收音机播放音乐即可。

阅读更多充满人情味的谷歌助理引发道德问题

来自加州大学伯克利分校和乔治敦大学的一群学生在2016年展示他们可以通过扬声器和YouTube视频隐藏白噪声命令,让智能设备打开飞行模式或打开网站。

本月,一些伯克利研究人员发表了一篇更进一步的研究论文,称他们可以将命令直接嵌入到音乐或口语文本的录音中。所以,当一个听众听到某人在说话或者管弦乐队演奏时,亚马逊的Echo演讲者可能会听到一条指令,在你的购物清单中添加一些东西。

加州大学伯克利分校计算机安全专业五年级博士生,该论文的作者之一,尼古拉斯卡利尼说:“我们想看看我们是否可以让它变得更加隐身。”

语音识别系统通常会将每个声音翻译成一个字母,最后将这些声音编译成单词和短语。通过对音频文件进行微小的改动,研究人员能够取消语音识别系统应该听到的声音,并用声音代替声音,这些声音会被机器以不同方式转录,而人耳几乎无法察觉。

亚马逊说,它没有披露具体的安全措施,但它已采取措施确保其Echo智能扬声器的安全。谷歌表示,安全是一个持续的焦点,其助手具有缓解无法检测的音频命令的功能。这两家公司的助理都使用语音识别技术来防止设备对某些命令采取行动,除非他们能够识别用户的声音。

苹果公司表示,其智能扬声器HomePod旨在防止指令进行开门操作等操作,并指出iPhone和iPad必须在Siri执行访问敏感数据或打开应用程序和网站的命令之前解锁。

Carlini和他在伯克利的同事将命令合并到Mozilla的DeepSpeech语音到文本翻译软件识别的音频中,这是一个开源平台。他们能够隐藏命令,“好的,谷歌,浏览到evil.com”在口头短语的记录中,“没有数据集,文章是无用的。”人类无法辨别命令。

伯克利小组还将该命令嵌入音乐文件中,其中包括来自威尔第的“安魂曲”的四秒钟片段。