洛特认为,高通的解决方案是面向未来的

2018-05-28 来源:手游巴士 作者:熊小姐

在美国波士顿举行的Re-Work深度学习峰会上,高通的人工智能研究人员克里斯-洛特(Chris Lott)展示了其团队在语音识别计划方面的新进展。

高通

这种语音识别系统在智能手机或其他便携式设备上运行,包含两个神经网络:循环神经网络(RNN)和卷积神经网络(CNN)。循环神经网络利用其内存来处理输入信息,而卷积神经网络则模仿人类大脑中神经元之间的联系方式。洛特称,这种语音识别系统识别单词和短语的准确率达到了95%。

“它可以学习你使用设备的习惯。”他说,“它能够根据你的习惯来进行个性化设置。”

洛特称,现在大多数语音识别系统在云端进行运算过程。手机中的麦克风和芯片,智能音箱如谷歌Home和亚马逊Echo,以及配置微软Cortana 语音助手的Windows电脑,可以让语音识别系统接倾听一些热门词汇,例如“OK Google”或Hey Cortana,从而接受一系列语音指令。但是,它们不会分析这些指令,而只是将这些指令传输到运行复杂机器学习算法的强大远程服务器上。

对于某些用户来说,将其语音数据上传到云端,这样会让他们担心隐私方面的问题。亚马逊Alexa和谷歌Assistant均会录制语音片段,然后将它们发送出去进行分析。它们会一直保留这些语音片段,直到用户选择删除它们。这两家公司均表示,它们录制语音是为了改善其服务,提供更加个性化的语音回答。

但是,在某些情况下,录制语音无法保护用户的隐私。在2016年,亚利桑那州调查一宗谋杀案的侦探在被告人的同意下访问了一台亚马逊Echo智能音箱中的语音数据。

洛特称,高通的这种语音识别系统直接在设备上处理数据,这样做除了可以保护用户的隐私之外,还具有多方面的好处。由于它不必将数据上传到云端,它对于指令的反应速度更快。由于它不需要连接互联网,因此它变得更加稳定。

“我们努力按照某种神经网络的形式来处理整个端到端系统。”他说,“这样可以让用户与设备的互动变得更加自然。”

洛特的话不无道理。在2016年,谷歌开发了一款离线语音识别系统,它的速度是同时期其在线语音识别系统的7倍。这个离线语音识别系统利用语音数据进行了大约2000个小时的训练,它的大小为20.3兆,在智能手机上运行,准确率为86.5%。

当然,这种设备端语音识别系统也有自身的局限性。离线工作的算法无法连接互联网,并搜索问题的答案。而且,它们无法像云端系统那样随着数据的积累不断地改进。

但是,洛特认为,高通的解决方案是面向未来的。“现在很多计算过程发生在云端,但是我们认为这个过程应该直接在设备上进行。”

上一篇:小米需要证明在未来3年年利润增长会达50%

下一篇:最后一页

相关推荐

乌拉圭17岁青年发现谷歌系统漏洞 奖励3.6万美元“漏洞赏金”

据CNBC报道,谷歌刚刚发给乌拉圭17岁青年埃兹基埃尔·佩雷拉(Ezequiel Pereira)3.6万美元“漏洞赏金”。他报告了一个安全漏洞,从而帮助谷歌内部系统做出改变

李彦宏:为保证用户体验 “简单搜索”APP将永远不会放广告

搜狐科技消息,在今年的贵阳数博会上,百度创始人、董事长兼首席执行官李彦宏在“人工智能”环节的演讲中称,在7月份与金龙合作量产的“阿波龙”下线时,他

微软提交给SEC的文件态度:强势上位AI

5月28日消息,“移动为先云为先”是现任微软CEO萨提亚·纳德拉此前上任时提出的一个战略,“云为先”方面微软的成果可谓斐然,也早已在华实现了全面

苹果:与美国国家安全相关的数据索取请求再次大幅增加

苹果上周五发布了2017年下半年政府数据索取透明度报告,报告显示,与美国国家安全相关的数据索取请求再次大幅增加。苹果透露,该公司在2017年下半年共收到16249条国家安全请求,影

传言称小米报敲定于7月初至7月中旬挂牌

据香港信报报道,传言称小米报敲定于7月初至7月中旬挂牌。据媒体引述知情人士称,小米将在6月底路演,游说欧美的机构投资者对其业务估值不低于700亿美元(约5460亿港元)。该人士

查看更多