认识达内从这里开始

认真做教育专心促就业

各企业如何利用用户语音数据开发人工智能系统

发布：运城达内教育官网
来源：互联网
时间：2019-04-18 08:30

随着互联网的不断发展，相信大家对于人工智能语言系统应该有过了解了吧。而今天我们就通过案例来了解一下，在语音系统开发上各企业都是如何使用的。

各企业如何利用用户语音数据开发人工智能系统

亚马逊

亚马逊表示，他们仅注释了 Alexa 录音的“极小一部分样本”，以改善客户体验。例如，训练语音识别和自然语言理解系统“以便 Alexa 能够更好地理解…命令。”他们会雇佣三方承包商审查这些录音，但表示其有“严格的技术和操作保障措施”以防止滥用，且员工无法直接访问识别信息，仅限于用户帐号、名字和设备序列号。

亚马逊发言人在一份声明中说：“我们使用多因素身份验证、限制访问、服务加密和审核控制环境来保证所有信息的高度机密性。”

在网络和应用设置页面中，亚马逊为用户提供了禁用录音功能的选项。然而，亚马逊表示，选择退出的用户仍可能会在常规审核过程中被手动分析录音。

苹果

苹果在其隐私页面的白皮书中讨论了 Siri 记录的音频审核流程。它解释道，人类“评分师”会审查并标记一小部分 Siri 数据用于开发和质量保证，每个评审员对回应的质量进行分类并指出正确的操作。其表示，这些标签可以“识别”系统，“不断”提升 Siri 的质量。

苹果补充说，为审查而保留的语音是加密和匿名的，与用户的姓名或身份无关。而且，人类审查员不会收到用户的随机识别码(每 15 分钟刷新一次)。苹果将这些录音存储了六个月，在此期间，Siri 的识别系统对它们进行了分析，以“更好地理解”用户的声音。副本被保存(没有识别码)用于改进和开发 Siri，存储时间为 6 个月至 2 年。

苹果允许用户完全退出 Siri 或仅使用“Type to Siri”工具进行本地设备类型或语言搜索。但它表示，无需标识符的录音和相关数据的“一小部分”识别码可能会继续在两年多时间内用于 Siri 持续改进和质量保证。

谷歌

谷歌发言人告诉 VentureBeat，他们进行“非常有限的一部分音频转录以改善语音识别系统”，但使用了“大量技术来保护用户隐私。”具体来说，谷歌称其使用的音频片段与任何个人身份信息无关，并且转录在很大程度上是自动化的，谷歌员工不经手处理。此外，如果使用三方服务来审查数据，则“通常”只提供文本，不提供音频。

谷歌还表示正在开发不需要人类标签的技术，并且已经发布了针对此目的的研究。例如，在文本到语音(TTS)领域，其Tacotron 2 系统可以仅基于频谱图构建语音合成模型，而其 WaveNet 系统可以根据声波生成模型。

谷歌会无限期地存储谷歌语音助手记录的音频片段。然而，与亚马逊和苹果一样，它允许用户永久删除这些录音，并选择退出未来的数据收集。当然，代价是享受不到语音助手和语音搜索服务。也就是说，谷歌在其隐私政策中的这段话值得注意：“可能会保留与服务相关的信息”，以“防止垃圾邮件和滥用”并“改善 [其] 服务”。

微软

微软的支持页面上概述了有关 Cortana 的隐私惯例。该页面显示，微软收集语音数据以“[增强] Cortana 对个人用户语音模式的理解”，并“不断改进”Cortana 的识别和响应能力，以及“改进”采用语音识别和意图的其他产品和服务的理解能力。

页面上并没有表明微软员工或三方承包商是否对数据进行人工审核，以及数据是如何匿名的，但该公司表示，当兼容的笔记本电脑和 PC 上启用了始终聆听“Hey Cortana”功能时，Cortana 只有在听到提示后才收集语音输入。

微软允许用户通过访问 Windows 10 中的在线仪表板或搜索页面来选择退出语音数据收集、个性化和语音识别。可以预见，禁用语音识别让 Cortana 停止响应语音。但是与谷歌语音助手一样，Cortana 可以识别出输入的命令。

【免责声明】：本内容转载于网络，转载目的在于传递信息。文章内容为作者个人意见，本平台对文中陈述、观点保持中立，不对所包含内容的准确性、可靠性与完整性提供形式地保证。请读者仅作参考。

< 上一篇：JavaScript编程环境下事件模拟注意事项

下一篇：程序员能力提升应该注重深度还是宽度 >