图片 1

“今日俄罗斯”网站27日报道,有人揭发苹果公司旗下电子产品中的智能语音助手Siri泄露用户隐私。爆料者称,Siri会对人们的隐私活动进行录音——包括但不限于性接触、医患交谈、毒品交易等,并将音频偷偷发送给评估师进行评估。

图片 2

据调查称,亚马逊工作人员每天都会审查Alexa录下的成千上万录音内容 –
包括夫妻争吵和发生性关系的片段。

图片 3

图1/3

这些片段被流行的数字助理意外捕获 – 混淆了它应该收听的命令-
并被送去分析。

报道援引英国《卫报》消息称,根据匿名爆料者的说法,Siri的录音是分发给全世界评估师的,这些人负责为Siri的反馈质量进行评估,来看它的回答是否经过了“深思熟虑”。

专家表示,位置数据实际上要比许多其他类别的用户信息更敏感。

每500份Alexa录制的录音中,就会有一份是经过这家科技公司的员工审核的,无论是对数字助手有意命令还是偶然录制。

爆料人说:“有数不清的医患交谈、商务交易、疑似犯罪交易、性行为等私密交谈的录音,而这些录音还带着诸如地点、联系记录和应用程序数据等用户信息。”据称,Siri被意外激活的频率远高于苹果方面公开的信息,其中尤以苹果手表用户最为突出。

编译 | 太浪

根据一位隐私专家的说法,这一披露提醒人们,科技公司拥有的用户个人信息有多么丰富。

对此,爆料人解释说,他们担心这些Siri在它“听到”它的“唤醒词”时自行激活并录下的内容,会给不经意间使用了它的人带来麻烦。何况,评估人可以“随便看”这些录音所携带的“庞大”用户数据。而据一些程序员说,仅仅是拉开拉链的声音就经常能激活Siri。“对于怀有不法企图的人,鉴别‘录音中的人’的身份并不是一件难事。”

编辑 | 宇多田

据《太阳报》称,亚马逊在罗马尼亚首都布加勒斯特有一个讲英语的团队,每天监控数千份Alexa录音,在波士顿、哥斯达黎加和印度也有类似的团队。

报道称,苹果公司并没有在其提供的文件中明确提到任何有关人类参与训练Siri的内容,只是在被问及训练内容时承认“一小部分提问会被分析,用来提高Siri和听写能力。”苹果公司坚称,这部分数据占日常激活量的比例不到1%,而且这些录音只有“象征性的几秒时长”。

参考来源 | Bloomberg

据称这些团队的成员知道数字助理意外捕获的各种个人时刻,包括争论,金钱谈话,对医疗问题的坦诚讨论以及Alexa用户发生性行为的声音。

苹果公司强调,评估人并不会在分析音频片段时看到用户帐号和名字,并解释称这些片段“在安全的设施内,而且所有评估人都必须遵守苹果严格的保密要求”。

智能音箱引发的数据隐私问题,因为亚马逊员工的独家爆料而掀起新一轮热议。

亚马逊的一位前分析师告诉《太阳报》,有人说,工作人员已经听到夫妻发生性行为,甚至听起来像性侵犯。

RT称,Siri当然不是唯一会将用户隐私传回“母舰”的智能语音助手,亚马逊的Alexa就会为它的人类训练师准备完整的聊天内容用以讨论那些“难以听懂”的音频,而谷歌Home则使用外包“语言专家”来保证其公司内部并不能访问他们的设备所录下的音频。

据五名熟悉 Alexa 程序的员工告诉彭博社,审核 Alexa 用户命令的团队可以访问
Alexa 客户的位置数据,并且在某些情况下,还可以轻松找到客户的家庭住址。

“有时我听到夫妻俩在家里争吵,而另一些时候,孩子们正在试图教Alexa骂人。”

就这一点,英国《卫报》在26日的报道中提到,亚马逊和谷歌都允许用户关掉部分录音功能,但苹果并没有提供类似的能够让用户彻底禁用Siri的选项。据统计,苹果在智能手表市场占据着35%的份额,三倍于市场占有率仅次于它的竞争对手三星,并且比它剩下的六个最大竞争者加在一起都多。

彭博社在本月早些时候披露了这个项目的存在,它的成立是为了帮助亚马逊的数字语音助手更好地理解和响应用户的命令,转录、注释和分析
Alexa 收录的部分录音。

“我们被告知要专注于Alexa命令,但不可能不听其他事情发生。”

《卫报》称,苹果公司非常看重它在保护用户隐私方面的声誉,还经常以其作为与亚马逊和谷歌竞争的优势。就在今年1月,苹果在美国拉斯维加斯举办的美国消费电子展上声明,“在你苹果手机上发生的一切,都将止步于你的手机。”

图片 4

“亚马逊告诉我们,我们听到的每个用户都是同意的,所以我从未觉得自己是在偷窥。”

图1/3

据估计,亚马逊的Echo和Echo
dot智能扬声器(Alexa在其上运营)仅在英国就有大约650万个家庭使用。

专家表示,位置数据实际上要比许多其他类别的用户信息更敏感。

卡巴斯基首席安全研究员David
Emm表示,亚马逊Alexa的所有者都可能会被亚马逊员工可以听到私密时刻的消息所震惊。

编译 | 太浪

“虽然亚马逊Echo等数字助理应该被一个特定的’唤醒’字激活,但最近这些设备一次又一次成为侵犯人们隐私的头条新闻,所以问题是,这种情况什么时候才是个头?”

编辑 | 宇多田

“这些设备旨在改善我们的生活,而不是监视我们!”

参考来源 | Bloomberg

在Twitter上,各种Alexa用户报告他们的智能扬声器设备被随机声音意外激活 –
甚至没有明显原因。

智能音箱引发的数据隐私问题,因为亚马逊员工的独家爆料而掀起新一轮热议。

Emm补充说,随着家庭和企业智能扬声器数量的不断增长,消费者需要意识到“在家里发生的事情并不一定留在家里”。

据五名熟悉 Alexa 程序的员工告诉彭博社,审核 Alexa 用户命令的团队可以访问
Alexa 客户的位置数据,并且在某些情况下,还可以轻松找到客户的家庭住址。

他说,对数字助理的所有者来说,这是一个令人震惊的警钟,供应商可以访问大量的个人信息。

彭博社在本月早些时候披露了这个项目的存在,它的成立是为了帮助亚马逊的数字语音助手更好地理解和响应用户的命令,转录、注释和分析
Alexa 收录的部分录音。

这些信息不仅对可能可以访问数据的网络犯罪分子具有潜在价值,而且也对广告商具有潜在价值。

这些员工称,能够访问 Alexa
用户地理坐标的团队成员可以很轻松地将它们输入第三方地图软件,并找到用户的住宅所在地。不过这些员工签署的保密协议禁止他们公开谈论这个项目。

“这些信息可能会被恶意使用,甚至被信任的一方利用,”Emm说。

虽然没有迹象表明拥有访问数据权限的亚马逊员工曾试图追踪个人用户,但 Alexa
团队的两名成员向彭博社表达了他们的担忧,他们认为亚马逊授予了不必要的广泛访问客户数据的权限,这将使
Alexa 设备所有者更容易被识别。

“亚马逊,谷歌和任何其他制造商必须采取行动,以防止继续侵犯隐私。”

图片 5

“他们应该明确收集哪些数据以及如何存储这些数据,并让人们能够有权选择。”

图2/3

亚马逊发言人表示“我们认真对待客户信息的安全性和隐私性”。

乔治敦大学法学院通信与技术诊所的教学研究院、律师林赛·巴雷特(Lindsey
Barrett)说,位置数据比许多其他类别的用户信息更敏感。

“为了改善客户体验,我们标注了不到百分之一的客户互动。”

「任何时候,只要有人在你所在的地方收集信息,这就意味着信息可能会流向其他人,当你不想被找到的时候,他们可能会找到你。」她说,广泛访问与
Alexa 用户录音相关的位置数据「将会为我的地点插上一面大红旗」。

他们解释说,这些信息有助于亚马逊培训其语音识别和自然语言口译系统,目的是让Alexa更好地理解用户请求。

早在 4 月 10 日的一份声明中,亚马逊就公开了 Alexa
的审计程序。他们是这样说的,「作为整个流程中的一环,员工无法直接访问能够识别个人或账户的信息。」(注意,监听用户与
Alexa 的对话内容,是帮助 Alexa 改善体验、使其更加智能的其中一环。)

发言人继续说:“我们有严格的技术和操作保障措施来保护客户隐私,并对滥用我们系统的行为采取零容忍政策。”

亚马逊在回应这一最新员工爆料事件的一份新声明中表示,「对内部工具的访问受到严格控制,并且仅授权给了有限数量的员工,他们需要通过处理极少量的交互样本来训练机器和改进服务。我们的政策严格禁止员工因任何其他原因访问或使用客户数据,我们对滥用系统的行为采取零容忍政策。我们定期审查员工对内部工具的访问权限,并尽可能地限制访问权限。」

“数据助理不会收到可以识别客户的信息,对内部工具的访问受到高度控制,客户可以随时删除与其帐户相关的录音。”

亚马逊的 Alexa Data Services(Alexa
数据服务)团队负责管理大量人类语音记录和其他数据,这些数据对训练语音软件有很大帮助。这个团队包含承包商和亚马逊全职员工,他们分布在世界各地,从波士顿到哥斯达黎加、印度和罗马尼亚。

据《太阳报》报道,此外,听取录音的亚马逊代理商受到严格保密规则的约束。

一些负责分析 Alexa
客户录音的工作人员使用了亚马逊的一个内部工具,该工具除了显示录音设备数据外,还显示音频片段。该软件存储的大部分信息(包括设备
ID 和客户身份号码)都不能轻易地链接回用户。

而就在前几天,苹果Siri也被爆料会在意外激活情况下,录下用户私密行为的声音,而苹果也是声称这些数据“用于帮助Siri和听写……更好地了解你,并识别你所说的话”。

然而,亚马逊还收集位置数据,以便 Alexa
能够更准确地回答用户的请求,例如,推荐一家当地餐馆或提供附近俄勒冈州阿什兰的天气信息,而不是遥远的密歇根州阿什兰的天气信息。

在彭博社看到的一个演示中,一名亚马逊团队成员将一个用户的坐标(以经度和纬度的形式存储在系统中)粘贴到谷歌地图中,在不到一分钟的时间里,这个员工就从此人的
Alexa 命令的录音跳转到了一个看起来是他们家和相应地址的图像上。

目前还不清楚有多少人能够使用这个系统。两名亚马逊员工表示,他们相信,Alexa
数据服务团队的绝大多数员工直到最近都能够使用该软件。

值得注意的是,有时候 Amazon 会默认获取数据。

就在去年,当客户第一次向 Echo
智能音箱提出与位置有关的问题时,该公司经常利用该设备的互联网连接获得其大致位置。

最近,该公司开始使用与客户帐户关联的送货地址作为 Echo 的默认位置。

Amazon 的位置数据并不总是精确的,也并不总是指向 Echo 的位置。

实际上,当用户设置智能音箱时,Alexa 智能手机 APP
会提示用户输入家庭地址,并请求用户允许其使用智能手机的位置数据。(这套程序在中国是一个很常见的现象)。

在一个关于 Alexa
的常见问题列表中,亚马逊表示,它使用移动设备位置来提供更多相关的答案和建议,并启用提醒等功能,比如,当用户到达某个地方时,这些功能就会被触发。

据其中一名员工说,亚马逊的另一个内部软件工具存储了更多的个人数据,这个工具只提供给一小部分员工,他们使用这个工具给语音记录做标记,以帮助
Alexa 对用户请求进行分类。

这名员工说,在输入客户身份号码后,这些被称为注释者和验证者的工作人员可以看到客户在进入
Alexa app 设置这个设备时输入的家庭、工作地址和电话号码。

如果用户选择与 Alexa
共享他们的联系人,则他们的姓名、电话号码和电子邮件地址也会出现在仪表板上。

这些数据在系统中,因此,如果客户说「发消息给
Laura」,人工审核员可以确保转录者正确地写入名称,以便软件学会将该请求与联系人列表中的
Laura 配对。

不过,亚马逊似乎一直在限制员工对系统的访问权限。

一名员工说,就在一年前,亚马逊有一个仪表盘,详细记录了用户的联系人信息,并显示了完整的电话号码。现在,在同一个面板中,一些数字被遮挡了。

两名员工表示,在彭博社 4 月 10
日的报道发布后,亚马逊进一步限制了对数据的访问。这些知情人士说,一些负责转录、注释和验证音频记录的数据助理来上班时发现,他们无法再使用以前在工作中使用过的软件工具。截至发稿,他们的访问权限尚未恢复。

机器学习?

不,让音箱更好理解语言的是人类劳力

大多数现代语音识别系统依赖于以人脑为模型的神经网络。该软件通过在海量数据中发现规律来进行学习,为
Echo 和其他智能音箱提供动力的算法使用概率模型来进行有根据的猜测。

譬如,如果有人问 Alexa
附近是否有希腊餐馆时,算法知道用户可能在找一家餐馆,而不是教堂或社区中心。

但有时 Alexa
会出错ーー尤其是在处理新的俚语、地区俗语或英语以外的其他语言时。

举个例子,法语中的 avec
sa(读音:阿维克萨,意为「与其」),会让软件误以为有人在使用 Alexa
的唤醒词;而西班牙语中的 Hecho 指的是事实或行为,有时会被误解为 Echo
。诸如此类。

因此,亚马逊雇佣人类帮手,填补算法遗漏的空白。

目前,亚马逊在世界各地雇佣了数千名员工来帮助改进 Alexa 数字助理,为 Echo
系列音箱提供动力。

这个团队有权利收听从 Echo 主人家中和办公室里捕获的录音。

这些录音被转录、注释,然后反馈到软件中,这是为了消除 Alexa
对人类语言理解的差距,帮助它更好地响应人类的命令。

据 7 名参与该项目的人员描述,Alexa
语音审核流程突出了经常被疏忽的人类在训练软件算法中扮演的角色。

在营销材料中,亚马逊称,Alexa「生活在云中,而且变得越来越聪明。」
但是就像许多从经验中学习的软件工具一样,人类也在做一些教学工作。

据知情人士透露,该团队由承包商和亚马逊的全职员工组成,他们分布世界各地,从波士顿到哥斯达黎加、印度和罗马尼亚。他们签署的保密协议,禁止他们公开谈论该计划。

亚马逊位于布加勒斯特的办公室坐落于罗马尼亚首都颇具发展前景的 Pipera
区,占据了环球价值大厦 (Globalworth building)
的前三层。据该办公室的两名员工说,他们每天工作 9
个小时,每个审查人员每班要分析多达 1000 个音频片段。

现代化的设施在破败的基础设施中脱颖而出,但没有任何外部标志表明这就是亚马逊的办公室。

这项工作大部分都是单调的。

波士顿的一名工作人员说,他从累积的语音数据中挖掘出一些特定的话语,比如「泰勒
· 斯威夫特」,并对它们进行注释,以表明搜索者指的是那位音乐艺术家。

偶尔,听众会听到 Echo
的主人可能更愿意保持低调的东西:比如,一个女人在淋浴时唱歌唱错了调,或者一个孩子尖叫着寻求帮助。