Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

Bloomberg来源太浪编译宇多田编辑

亚马逊员工再爆Alexa可查家庭住址与电话号码, 体验与隐私真的平衡不了?

专家表示,位置数据实际上要比许多其他类别的用户信息更敏感。

智能音箱引发的数据隐私问题,因为亚马逊员工的独家爆料而掀起新一轮热议。

据五名熟悉 Alexa 程序的员工告诉彭博社,审核 Alexa 用户命令的团队可以访问 Alexa 客户的位置数据,并且在某些情况下,还可以轻松找到客户的家庭住址。

彭博社在本月早些时候(4 月 10 日)披露了这个项目的存在,它的成立是为了帮助亚马逊的数字语音助手更好地理解和响应用户的命令,转录、注释和分析 Alexa 收录的部分录音。

这些员工称,能够访问 Alexa 用户地理坐标的团队成员可以很轻松地将它们输入第三方地图软件,并找到用户的住宅所在地。不过这些员工签署的保密协议禁止他们公开谈论这个项目。

虽然没有迹象表明拥有访问数据权限的亚马逊员工曾试图追踪个人用户,但 Alexa 团队的两名成员向彭博社表达了他们的担忧,他们认为亚马逊授予了不必要的广泛访问客户数据的权限,这将使 Alexa 设备所有者更容易被识别。

乔治敦大学法学院通信与技术诊所的教学研究院、律师林赛·巴雷特(Lindsey Barrett)说,位置数据比许多其他类别的用户信息更敏感。

「任何时候,只要有人在你所在的地方收集信息,这就意味着信息可能会流向其他人,当你不想被找到的时候,他们可能会找到你。」她说,广泛访问与 Alexa 用户录音相关的位置数据「将会为我的地点插上一面大红旗(红色标记)」。

早在 4 月 10 日的一份声明中,亚马逊就公开了 Alexa 的审计程序。他们是这样说的,「作为整个流程中的一环,员工无法直接访问能够识别个人或账户的信息。」(注意,监听用户与 Alexa 的对话内容,是帮助 Alexa 改善体验、使其更加智能的其中一环。)

亚马逊在回应这一最新员工爆料事件的一份新声明中表示,「对内部工具的访问受到严格控制,并且仅授权给了有限数量的员工,他们需要通过处理极少量的交互样本来训练机器和改进服务。我们的政策严格禁止员工因任何其他原因访问或使用客户数据,我们对滥用系统的行为采取零容忍政策。我们定期审查员工对内部工具的访问权限,并尽可能地限制访问权限。」

 亚马逊的 Alexa Data Services(Alexa 数据服务)团队负责管理大量人类语音记录和其他数据,这些数据对训练语音软件有很大帮助。这个团队包含承包商和亚马逊全职员工,他们分布在世界各地,从波士顿到哥斯达黎加、印度和罗马尼亚。

一些负责分析 Alexa 客户录音的工作人员使用了亚马逊的一个内部工具,该工具除了显示录音设备数据外,还显示音频片段。该软件存储的大部分信息(包括设备 ID 和客户身份号码)都不能轻易地链接回用户。

然而,亚马逊还收集位置数据,以便 Alexa 能够更准确地回答用户的请求,例如,推荐一家当地餐馆或提供附近俄勒冈州阿什兰的天气信息,而不是遥远的密歇根州阿什兰的天气信息。

在彭博社看到的一个演示中,一名亚马逊团队成员将一个用户的坐标(以经度和纬度的形式存储在系统中)粘贴到谷歌地图中,在不到一分钟的时间里,这个员工就从此人的 Alexa 命令的录音跳转到了一个看起来是他们家和相应地址的图像上。

目前还不清楚有多少人能够使用这个系统。两名亚马逊员工表示,他们相信,Alexa 数据服务团队的绝大多数员工直到最近都能够使用该软件。

值得注意的是,有时候 Amazon 会默认获取数据。

就在去年,当客户第一次向 Echo 智能音箱提出与位置有关的问题时,该公司经常利用该设备的互联网连接获得其大致位置。

最近,该公司开始使用与客户帐户关联的送货地址作为 Echo 的默认位置。

Amazon 的位置数据并不总是精确的,也并不总是指向 Echo 的位置。

实际上,当用户设置智能音箱时,Alexa 智能手机 APP 会提示用户输入家庭地址,并请求用户允许其使用智能手机的位置数据。(这套程序在中国是一个很常见的现象)。

在一个关于 Alexa 的常见问题列表中,亚马逊表示,它使用移动设备位置来提供更多相关的答案和建议,并启用提醒等功能,比如,当用户到达某个地方时,这些功能就会被触发。

据其中一名员工说,亚马逊的另一个内部软件工具存储了更多的个人数据,这个工具只提供给一小部分员工,他们使用这个工具给语音记录做标记,以帮助 Alexa 对用户请求进行分类。

 这名员工说,在输入客户身份号码后,这些被称为注释者和验证者的工作人员可以看到客户在进入 Alexa app 设置这个设备时输入的家庭、工作地址和电话号码。

如果用户选择与 Alexa 共享他们的联系人,则他们的姓名、电话号码和电子邮件地址也会出现在仪表板上。

这些数据在系统中,因此,如果客户说「发消息给 Laura」,人工审核员可以确保转录者正确地写入名称,以便软件学会将该请求与联系人列表中的 Laura 配对。

不过,亚马逊似乎一直在限制员工对系统的访问权限。

一名员工说,就在一年前,亚马逊有一个仪表盘,详细记录了用户的联系人信息,并显示了完整的电话号码。现在,在同一个面板中,一些数字被遮挡了。

两名员工表示,在彭博社 4 月 10 日的报道发布后,亚马逊进一步限制了对数据的访问。这些知情人士说,一些负责转录、注释和验证音频记录的数据助理来上班时发现,他们无法再使用以前在工作中使用过的软件工具。截至发稿,他们的访问权限尚未恢复。

机器学习

不,让音箱更好理解语言的是人类劳力

大多数现代语音识别系统依赖于以人脑为模型的神经网络。该软件通过在海量数据中发现规律来进行学习,为 Echo 和其他智能音箱提供动力的算法使用概率模型来进行有根据的猜测。

譬如,如果有人问 Alexa 附近是否有希腊餐馆时,算法知道用户可能在找一家餐馆,而不是教堂或社区中心。

但有时 Alexa 会出错ーー尤其是在处理新的俚语、地区俗语或英语以外的其他语言时。

举个例子,法语中的 avec sa(读音:阿维克萨,意为「与其」),会让软件误以为有人在使用 Alexa 的唤醒词;而西班牙语中的 Hecho 指的是事实或行为,有时会被误解为 Echo 。诸如此类。

因此,亚马逊雇佣人类帮手,填补算法遗漏的空白。

目前,亚马逊在世界各地雇佣了数千名员工来帮助改进 Alexa 数字助理,为 Echo 系列音箱提供动力。

这个团队有权利收听从 Echo 主人家中和办公室里捕获的录音。

这些录音被转录、注释,然后反馈到软件中,这是为了消除 Alexa 对人类语言理解的差距,帮助它更好地响应人类的命令。

据 7 名参与该项目的人员描述,Alexa 语音审核流程突出了经常被疏忽的人类在训练软件算法中扮演的角色。

在营销材料中,亚马逊称,Alexa「生活在云中,而且变得越来越聪明。」 但是就像许多从经验中学习的软件工具一样,人类也在做一些教学工作。

据知情人士透露,该团队由承包商和亚马逊的全职员工组成,他们分布世界各地,从波士顿到哥斯达黎加、印度和罗马尼亚。他们签署的保密协议,禁止他们公开谈论该计划。

亚马逊位于布加勒斯特的办公室坐落于罗马尼亚首都颇具发展前景的 Pipera 区,占据了环球价值大厦 (Globalworth building) 的前三层。据该办公室的两名员工说,他们每天工作 9 个小时,每个审查人员每班要分析多达 1000 个音频片段。

现代化的设施在破败的基础设施中脱颖而出,但没有任何外部标志表明这就是亚马逊的办公室。

这项工作大部分都是单调的。

波士顿的一名工作人员说,他从累积的语音数据中挖掘出一些特定的话语,比如「泰勒 · 斯威夫特」,并对它们进行注释,以表明搜索者指的是那位音乐艺术家。

偶尔,听众会听到 Echo 的主人可能更愿意保持低调的东西:比如,一个女人在淋浴时唱歌唱错了调,或者一个孩子尖叫着寻求帮助。

在需要帮助解析一个混乱的单词时或遇到一段有趣的录音时,该团队的人会使用内部聊天室来共享文件。

亚马逊在布加勒斯特的办公室,位于环球价值大厦(Globalworth building)。摄影师:Irina Vilcu/Bloomberg

有时,他们会听到令人不安的录音,或者可能是犯罪的录音。

其中两名工作人员说,他们发现了他们认为是性侵犯的东西。

当这样的事情发生时,他们可能会在内部聊天室分享经历,以缓解压力。

值得注意的是,一些员工需要记下说话者所听到的一切,包括背景对话ーー即使是在孩子们说话的时候。

有时候,侦听器会听到用户讨论私人信息,如姓名或银行详细信息;在这种情况下,他们应该勾选一个表示「关键数据」的对话框,然后处理下一个音频文件。

根据亚马逊网站的说法,除非 Echo 检测到唤醒词或按下按钮激活它,否则他们不会存储音频。

但有时,Alexa 似乎在没有任何提示的情况下就开始录音了,音频文件以刺耳的电视声或难以理解的噪音开始。无论激活是否是错误的,审查人员都需要将其转录。

其中一位知情人士说,在 Alexa 没有收到唤醒命令或者是被意外触发的情况下,审计员每天转录的录音都多达 100 条。

根据两位审查员的说法,在世界各地的家庭中,Echo 的用户经常猜测谁可能正在听他们说话,「你为国家安全局工作吗?」他们问,「Alexa,有人在听我们说话吗?」

亚马逊曾在上上周表示,当工作人员听到令人沮丧的消息时,他们会遵守相关程序,但两名驻罗马尼亚的员工表示,在请求对此类案件进行指导后,他们被告知,亚马逊无权干预。

「我们非常重视客户个人信息的安全和隐私,」亚马逊发言人在一份电子邮件声明中表示,「为了改善客户体验,我们只对极少数 Alexa 语音记录样本进行注释。例如,这些数据可以帮助我们训练我们的语音识别自然语言理解系统,这样,Alexa 可以更好地理解您的请求,并确保服务适合每个人。」

公司还强调:「我们有严格的技术和操作保障措施,并对滥用我们的系统采取零容忍政策。员工无法直接访问可在此工作流程中识别此人或帐户的信息。所有的信息都被高度保密,我们使用多重身份验证来限制访问,对服务进行加密以及审计我们的控制环境,来保护这些信息。」

然而,亚马逊在其市场营销和隐私政策材料中并没有明确表示人们正在收听 Alexa 收集的一些对话录音。除了该公司在一份常见问题列表中表示:「我们利用您向 Alexa 提出的请求来培训我们的语音识别自然语言理解系统。」

只是,在 Alexa 的隐私设置中,亚马逊为用户提供了禁止使用其录音来开发新功能的选项。

不过,那些选择退出该项目的人可能仍然会在常规审查过程中手动分析他们的录音。

彭博社曾根据截图显示认为,发送给 Alexa 审阅者的录音并没有提供用户的全名和地址,而是与账号、用户的名字和设备的序列号相关联。但这次员工的再次爆料,则承认了审阅者可以查看用户地址及姓名。

今年早些时候,The Intercept 报道称,亚马逊旗下 Ring 的员工手动识别该公司门铃摄像头拍摄的视频中手动识别车辆和人员,以更好地训练该软件自己完成这项工作。

「你并不一定会想到另一个人会在你家里亲昵地听你告诉智能音箱的内容。」密歇根大学教授弗洛里安·绍布(Florian Schaub)曾研究过与智能音箱有关的隐私问题,他说,「我想,我们已经习惯于这样一种假设,即这些机器只是在进行神奇的机器学习。但事实是,它仍然需要手工处理。」

「这是否涉及隐私问题,取决于亚马逊和其他公司对他们手工标注的信息类型的谨慎程度,以及他们如何向别人展示这些信息。」他补充道。

亚马逊公司一样,苹果公司的 Siri 也有人类助手,他们负责判断数字助手对请求的解读是否与用户所说的一致。

根据苹果的安全白皮书,他们审查的录音缺乏可识别个人身份的信息,并与随机标识符绑定存储 6 个月。

在此之后,数据将被剔除随机识别信息,但可以存储更长时间,以提高 Siri 的语音识别能力。

而在谷歌,一些评审员可以从谷歌助手那里获得一些音频片段来帮助训练和改进产品,但是谷歌表示,这些音频片段与任何个人身份信息无关,而且音频是失真的。

最近,亚马逊发布了一则招聘启事,为布加勒斯特的 Alexa 数据服务团队招一名质量保证经理,它在招聘广告中这样描述人类扮演的角色:「每天,她 (Alexa) 倾听成千上万人用不同的语言与她谈论不同的话题,她需要我们的帮助来理解这一切。」招聘广告继续写道:「这是你从未见过的大数据处理。我们每天都在创造、标注、策划和分析大量的语音。」

你会选择什么

实际上,智能音箱与数据隐私之间其实有一个很大的冲突点:

足够好的个性化推荐需要更多细节性数据的支撑;而用户隐私数据暴露给机器,则会让用户感到困扰和恐慌。

这不仅仅是亚马逊的难题,也是所有智能音箱技术公司的难题与压力来源。

如果是你,你会选择以牺牲一些个人数据为代价换取更好的个性化推荐体验,还是更倾向于保护自己的个人数据放弃一些功能效果的实现?

原文链接:

https://www.bloomberg.com/news/articles/2019-04-10/is-anyone-listening-to-you-on-alexa-a-global-team-reviews-audio?srnd=technology-vp
https://www.bloomberg.com/news/articles/2019-04-24/amazon-s-alexa-reviewers-can-access-customers-home-addresses?srnd=technology-vp
产业亚马逊
相关数据
Amazon机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

噪音技术

噪音是一个随机误差或观测变量的方差。在拟合数据的过程中,我们常见的公式$y=f(x)+\epsilon$中$\epsilon$即为噪音。 数据通常包含噪音,错误,例外或不确定性,或者不完整。 错误和噪音可能会混淆数据挖掘过程,从而导致错误模式的衍生。去除噪音是数据挖掘(data mining)或知识发现(Knowledge Discovery in Database,KDD)的一个重要步骤。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

暂无评论
暂无评论~