课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
随着互联网的不断发展,相信大家对于人工智能语言系统应该有过了解了吧。而今天我们就通过案例来了解一下,在语音系统开发上各企业都是如何使用的。
亚马逊
亚马逊表示,他们仅注释了 Alexa 录音的“极小一部分样本”,以改善客户体验。例如,训练语音识别和自然语言理解系统“以便 Alexa 能够更好地理解…命令。”他们会雇佣三方承包商审查这些录音,但表示其有“严格的技术和操作保障措施”以防止滥用,且员工无法直接访问识别信息,仅限于用户帐号、名字和设备序列号。
亚马逊发言人在一份声明中说:“我们使用多因素身份验证、限制访问、服务加密和审核控制环境来保证所有信息的高度机密性。”
在网络和应用设置页面中,亚马逊为用户提供了禁用录音功能的选项。然而,亚马逊表示,选择退出的用户仍可能会在常规审核过程中被手动分析录音。
苹果
苹果在其隐私页面的白皮书中讨论了 Siri 记录的音频审核流程。它解释道,人类“评分师”会审查并标记一小部分 Siri 数据用于开发和质量保证,每个评审员对回应的质量进行分类并指出正确的操作。其表示,这些标签可以“识别”系统,“不断”提升 Siri 的质量。
苹果补充说,为审查而保留的语音是加密和匿名的,与用户的姓名或身份无关。而且,人类审查员不会收到用户的随机识别码(每 15 分钟刷新一次)。苹果将这些录音存储了六个月,在此期间,Siri 的识别系统对它们进行了分析,以“更好地理解”用户的声音。副本被保存(没有识别码)用于改进和开发 Siri,存储时间为 6 个月至 2 年。
苹果允许用户完全退出 Siri 或仅使用“Type to Siri”工具进行本地设备类型或语言搜索。但它表示,无需标识符的录音和相关数据的“一小部分”识别码可能会继续在两年多时间内用于 Siri 持续改进和质量保证。
谷歌
谷歌发言人告诉 VentureBeat,他们进行“非常有限的一部分音频转录以改善语音识别系统”,但使用了“大量技术来保护用户隐私。”具体来说,谷歌称其使用的音频片段与任何个人身份信息无关,并且转录在很大程度上是自动化的,谷歌员工不经手处理。此外,如果使用三方服务来审查数据,则“通常”只提供文本,不提供音频。
谷歌还表示正在开发不需要人类标签的技术,并且已经发布了针对此目的的研究。例如,在文本到语音(TTS)领域,其Tacotron 2 系统可以仅基于频谱图构建语音合成模型,而其 WaveNet 系统可以根据声波生成模型。
谷歌会无限期地存储谷歌语音助手记录的音频片段。然而,与亚马逊和苹果一样,它允许用户永久删除这些录音,并选择退出未来的数据收集。当然,代价是享受不到语音助手和语音搜索服务。也就是说,谷歌在其隐私政策中的这段话值得注意:“可能会保留与服务相关的信息”,以“防止垃圾邮件和滥用”并“改善 [其] 服务”。
微软
微软的支持页面上概述了有关 Cortana 的隐私惯例。该页面显示,微软收集语音数据以“[增强] Cortana 对个人用户语音模式的理解”,并“不断改进”Cortana 的识别和响应能力,以及“改进”采用语音识别和意图的其他产品和服务的理解能力。
页面上并没有表明微软员工或三方承包商是否对数据进行人工审核,以及数据是如何匿名的,但该公司表示,当兼容的笔记本电脑和 PC 上启用了始终聆听“Hey Cortana”功能时,Cortana 只有在听到提示后才收集语音输入。
微软允许用户通过访问 Windows 10 中的在线仪表板或搜索页面来选择退出语音数据收集、个性化和语音识别。可以预见,禁用语音识别让 Cortana 停止响应语音。但是与谷歌语音助手一样,Cortana 可以识别出输入的命令。
【免责声明】:本内容转载于网络,转载目的在于传递信息。文章内容为作者个人意见,本平台对文中陈述、观点保持中立,不对所包含内容的准确性、可靠性与完整性提供形式地保证。请读者仅作参考。