首页互联网 › 谷歌AI打电话刷屏,微软坐不住了-必定赢官方网站

谷歌AI打电话刷屏,微软坐不住了-必定赢官方网站

本文摘要:(微信官方账号:)出版社:这几天谷歌AI在朋友圈打了个假电话。

必定赢游戏平台

(微信官方账号:)出版社:这几天谷歌AI在朋友圈打了个假电话。可以说谷歌成功产生了一个热门话题。但这一整天吓坏了微软公司的公关们,被迫抢着发布技术声明,以回应微软已经搭建AI与真人对话的事实。美国时间5月8日,在2018年度开发者大会(Google I/O 2018)上,谷歌在智能语音助手Google Assistant中对新缩减的双工进行了解释。

它可以自己给餐馆、发廊和其他商业店面打电话,用户购票的时间很长。再想想I/O大会的直播视频:AI助手与人交流,完成了指令,这并不是什么新鲜事。如果你经常和Siri说话,或者你有天猫精灵和萧艾这样的聪明的演说家,你不会发现的。

和AI说话太难了。你必须清楚地发音,你必须一遍又一遍地说苏醒的话,所以你不能建立相互对话。双工深感意外:它不仅用大自然简洁的声音与电话另一端的人类交流,而且对方显然没有意识到来电者竟然是个【AI】。这是因为Google双工构建了对等对话,重新加入了辅助词emm,“uha”等。

是对话中常用的,可以解读对话的语境,不具备主动获取语料的功能。这种双向对话仍然是已经实现了会话式人工智能的微软、苹果、亚马逊、Facebook想要的方向。

谷歌这次大做文章,得到了高度关注。微软似乎坐不住了,匆匆出站说,等一下,我们又在建设这个技术突破了。

就此事,微软昨天发布了技术声明。以下是声明全文:全双工的意义在于,它需要从“嵌入式”进化为“人机通信”。

一字之差,大有价值。今年4月4日,我们在美国和中国实时公布了全双工Senses,并意识到业界将会认识到这项技术的价值,并减缓这方面的关注。我们很高兴看到更多的同行重新加入。

然而,人类历史上第一次,带有人工智能的全双工语音通话并没有在美国再次发生,而是在中国再次发生。我们很荣幸将这顶王冠献给我们的祖国。自2016年8月以来,微软(亚洲)互联网工程研究所已使萧冰和人类用户能够通过人类用户的倡议拨打多达60万个电话。

今天,我们发布一段两年前再次发生的真实电话录音,并将其作为有价值的信息献给世界各地说汉语的人。而这项技术已经完成了产品落地。在过去的两年里,在人类的训练下,萧冰建立了一个不限于任何封锁域,而是开放域的全双工语音对话。目前,微软登陆的对话场景包括传统手机、网络电话和智能扬声器设备,微软萧冰的车载路试正在进行中。

想体验全双工全双工语音,不用等几个星期,今天就可以。在微软萧冰登陆的产品中,我们向您介绍我们与小米合作的米家生态链的Yeelight智能硬件产品。当视频中使用附带的用户现实时,你会意识到:苏醒之后的倒计时对话;微软萧冰的用户预测模型,帮助用户在完成多项任务的萧冰的内容构建能力上变得精彩;最重要的是,人机情感交流的人工智能时代已经到来,所以让我们继续创新。在微软的声明中,发现了三个关键点:一是在技术层面,微软于今年4月4日宣布了“全双工语音交互”技术;其次,其实微软两年前就建了AI和人类对话;最后,在产品落地方面,微软的全双工语音交互没有多场景,配备全双工语音交互技术的微软萧冰经常出现在——米智能音箱的Yeelight智能硬件产品中。

微软的Full-Deplex Voice和谷歌双工的技术框架和搭建功能应该差不多。微软对“全双工语音交互技术”的定义是:与现有的单轮或多轮倒计时语音识别不同,这种新技术可以动态预测人类会说什么,动态分解并控制对话节奏,解读对话场景,构建说话人/听者之间的角色转换,还可以识别说话人的性别和正在说话的人数。

也就是说,与智能语音助手无法构建单轮语音不同,全双工语音交互与倒计时对话可以构建与人类的双向交流,而这种双向交流最罕见的场景就是电话交谈。因为打电话是一个短时间内连续通话的过程,双方对通话的即时反应被拒绝的最少。3月28日,微软还在北京召开媒体交流会,详细讲解了“全双工语音交互技术”。

据悉,全双工语音交互背后有两个关键技术:一是预测模型,边听边想;例如,当用户说出一个单词时,萧冰会再次问“好,你说吧”,然后转到完成的指令,这样完成的指令的空白时间就可以空出来了。另一种是分解模型(LSTM),可以更好的解读场景,自动分解还原。长时间的对话不是单向的问答,在必要时不会主动获取内容,并且可以在完成指令后绝望几秒后自动告诉用户结束对话。

现在微软萧冰使用全双工语音交互技术的所有恢复都是自己分解的,类似于传统的基于模块和搜索的恢复。(微软全双工语音交互技术,请参考之前的报道:《微软公司发大讨:要做到智商和情商兼备的语音助手》。谷歌双工的技术分析文章中也提到,双工的核心是TensorFlow extend(RFX)构建的RNN网络,谷歌用电子邮件的电话通话数据来训练双工的RNN网络。

该网络不会用于Google自动语音识别(ASR)的识别结果文本,也不会用于音频特征、会话历史、会话参数(如预期服务、当前时间)等。输出语音由自动语音识别系统(ASR)处理,分解后的文本不会与上下文数据和其他输出一起输出到RNN网络,分解后的接收文本将由文本到语音(TTS)系统读取。谷歌使用RNN作为分解模型,而微软使用LSTM。从经验来看,两种模式的效果差不多。

在Yeelight与微软的萧冰对话时,可以搭建一个20分钟的苏醒倒计时对话,有必要的语气词,积极获得期待,完成对话。在谷歌I/O大会的最后一天,获得年度图灵奖的Alphabet新任董事长约翰汉尼斯宣布,在购票领域,谷歌双工通过了图灵测试。也就是说,目前谷歌双工和人类对话,人类无法识别自己是机器人。

这个消息显然令人兴奋。与配备微软全双工语音交互技术的微软公司萧冰相比,谷歌双工的许多特点是其语音语调与真人完全一致,这是他们在收集真人声音方面训练了几个月的结果。谷歌表示,今年夏天,双工不会基于谷歌助手进行测试,从预订餐厅、预订发廊、告知节假日营业时间等事情开始。

微软的萧冰正在整合人工智能助手和聊天机器人,希望转移到各种场景,包括传统手机、网络电话和智能扬声器设备。微软萧冰的车载路试也在进行中。(Yeelight微软萧冰用户体验视频)微软全双工语音技术已经实现产品落地,但仍在被保持热点的谷歌双工测试,有点生气。

然而,如果我们回忆一下技术发展的历程,我们永远不会忘记,1844年,莫尔斯从华盛顿向巴尔的摩发出了人类历史上的第一封电报,上面写着:“上帝,你打了什么蜡?””;1876年,贝尔发明了世界上第一部电话,他的第一句话“沃森先生,今晚我是老板”,成为第一个通过电话传送的语音。但是人工智能助手和人类的第一次通话似乎无法定义,但是我们在人工智能的道路上还有很长的路要走。

涉及文章:不能打电话的AI背后:谷歌双工技术分析微软公司做了一个大讨论:为了实现语音助手智商和情商兼备的原创文章,允许禁刊。以下是发布通知。

本文关键词:必定赢游戏平台,必定赢官方网站

本文来源:必定赢游戏平台-www.iconaviv.com

转载本站文章请注明出处:必定赢游戏平台-必定赢官方网站 http://www.iconaviv.com/?p=1795

上一篇:

下一篇:

相关文章