亚马逊员工再曝“偷听”用户, 智能家居体验与隐私真的平衡不了?

amazon01

据彭博社报道,知情人士透露,亚马逊的一个负责评估Alexa用户指令的团队获取了用户定位数据,某些情况下还可以找到用户家庭住址。

该团队分布于三个大洲,他们负责抄录、注释和分析Alexa记录的一部分录音。该部门的目的是帮助亚马逊的数字语音助手更好地理解和响应用户指令。员工表示,能够接触Alexa用户地理坐标的团队成员只要在第三方地图软件中输入这些数据,便可轻而易举查找用户住址。

亚马逊员工再爆Alexa隐私问题

虽然没有迹象显示,可以接触这些数据的亚马逊员工有意追踪具体用户,但两位Alexa团队成员却担心,获得亚马逊这项用户数据访问权限的员工范围太广。

亚马逊在4月10日的声明中承认这个Alexa评估项目的存在,并表示“员工不会在工作中直接接触能够识别一个人或其帐号的信息。”

该公司在最新发布的声明中说:“内部工具的获取受到严格管制,只有数量有限的员工才会获得授权,他们需要通过这些工具来训练和改进这项服务,处理很小的交流样本。我们的政策因为很多原因严格限制员工获取和使用客户数据,我们也对滥用系统的行为零容忍。我们还会定期评估员工获取内部工具的权限,并在任何可能的时间和地点限制获取。”

amazon01

亚马逊的Alexa数据服务团队负责管理大量的人类语音录音,以及其他有助于训练语音软件的数据,其员工及合同工人数达到数以千计,分布于波士顿、罗马尼亚和印度的多个地方。

一些员工负责分析Alexa用户的录音,他们使用的一款亚马逊工具会显示出音频片段以及录制音频时所用的设备。很多信息都由软件存储,包括设备ID和用户识别码,但无法轻易关联到具体用户。

但亚马逊也会收集地理数据,这样Alexa就能更加精确地回答问题。例如,推荐当地饭店或播报天气状况。
在彭博社看到的演示中,一位亚马逊团队成员将软件中存储的用户经纬度数据输入谷歌地图。不到一分钟,这名员工就能从一个人的Alexa指令录音跳转到此人的房屋照片,还附带相应的地址。

目前还不清楚有多少人可以接触这套系统。两名亚马逊员工表示,他们认为绝大多数Alexa数据服务部门的员工直到最近都可以使用这款软件。

亚马逊有时候会默认收集数据。去年,第一次有用户向Echo智能音箱询问跟地理位置有关的问题,该公司通常会使用设备的网络链接来获取大致位置。最近,他们开始使用跟客户帐号关联的邮寄地址作为Echo的默认定位数据。

体验与隐私真的平衡不了?

亚马逊的地理数据并不精确,而且不会每次都提供给Echo参考。Alexa智能手机应用会在用户设置智能音箱时提示其输入家庭住址,而且会索取智能手机定位数据使用权限。

amazon2018122104

在Alexa的常见问题里列表中,亚马逊表示它会使用移动设备定位数据来提供更加相关的答案和推荐,并在用户到达某个地方时触发提醒功能。

第二项亚马逊内部软件工具可供更少的员工使用,他们负责给录音文本增加标签,帮助Alexa对请求进行分类。该工具中存储了更多个人数据。

在关联了用户ID后,这些员工还可以看到用户设置设备时输入到Alexa应用里的家庭和工作地址,以及手机号码。如果一个用户选择与Alexa分享联系信息,其姓名、号码和邮箱地址也会出现在控制面板上。存储这些数据后,当用户说“给劳拉发条短信”时,人类审核员就可以确定系统抄录的姓名准确无误,从而让软件学习将这条请求与通讯录中的劳拉匹配起来。

彭博社曾根据截图显示认为,发送给 Alexa 审阅者的录音并没有提供用户的全名和地址,而是与账号、用户的名字和设备的序列号相关联。但这次员工的再次爆料,则承认了审阅者可以查看用户地址及姓名。

今年早些时候,The Intercept 报道称,亚马逊旗下 Ring 的员工手动识别该公司门铃摄像头拍摄的视频中手动识别车辆和人员,以更好地训练该软件自己完成这项工作。

“你并不一定会想到另一个人会在你家里亲昵地听你告诉智能音箱的内容。”密歇根大学教授弗洛里安·绍布(Florian Schaub)曾研究过与智能音箱有关的隐私问题,他说,“我想,我们已经习惯于这样一种假设,即这些机器只是在进行神奇的机器学习。但事实是,它仍然需要手工处理。”

“这是否涉及隐私问题,取决于亚马逊和其他公司对他们手工标注的信息类型的谨慎程度,以及他们如何向别人展示这些信息。”他补充道。

与亚马逊公司一样,苹果公司的 Siri 也有人类助手,他们负责判断数字助手对请求的解读是否与用户所说的一致。

根据苹果的安全白皮书,他们审查的录音缺乏可识别个人身份的信息,并与随机标识符绑定存储 6 个月。在此之后,数据将被剔除随机识别信息,但可以存储更长时间,以提高 Siri 的语音识别能力。

而在谷歌,一些评审员可以从谷歌助手那里获得一些音频片段来帮助训练和改进产品,但是谷歌表示,这些音频片段与任何个人身份信息无关,而且音频是失真的。

最近,亚马逊发布了一则招聘启事,为布加勒斯特的 Alexa 数据服务团队招一名质量保证经理,它在招聘广告中这样描述人类扮演的角色:“每天,她 (Alexa) 倾听成千上万人用不同的语言与她谈论不同的话题,她需要我们的帮助来理解这一切。”招聘广告继续写道:“这是你从未见过的大数据处理。我们每天都在创造、标注、策划和分析大量的语音。”

你会选择什么

实际上,智能音箱与数据隐私之间其实有一个很大的冲突点:

足够好的个性化推荐需要更多细节性数据的支撑;而用户隐私数据暴露给机器,则会让用户感到困扰和恐慌。

这不仅仅是亚马逊的难题,也是所有智能音箱技术公司的难题与压力来源。

如果是你,你会选择以牺牲一些个人数据为代价换取更好的个性化推荐体验,还是更倾向于保护自己的个人数据放弃一些功能效果的实现?

未经允许不得转载:数智网 » 亚马逊员工再曝“偷听”用户, 智能家居体验与隐私真的平衡不了?

分享到: