怎样看待百度宣称的未来语音交互无唤醒词

从技术本身来说,无唤醒词的语音交互已经成为一个趋势。很多厂商已经有了相对明确的解决方案,但绝大多数还是基于可控的对话范围内的。因为一旦没有唤醒词,系统需要根据声学定位和NLU的理解等条件去判断这句话是不是和它来说的。这里面尤其需要语义理解的继续提高。从人机交互的角度,要实现自然的语音交互,实现让用户可以更加无感知且自然的与系统交互,唤醒的方案必须要继续提高。比如,你和你的一个朋友对话时,首先你会有意提到让他意识到这是开始一个与他有关的话题(唤醒词或者强相关语义);其次从声音的角度,你也可能更朝向他说话(声学定位)。之后就可以自然的交流。而不是一遍一遍的叫他的名字。当前,大多数系统受技术的限制,都基于一次性对话进行设计,多轮对话,上下文的语义关联都还非常有限。但未来技术的提升必然要求多轮,多模态的自然语言交流,所以我认为这是一个很快就将普遍的方案。
■网友
robin回家跟他爸爸说话也不叫人吗?!

【怎样看待百度宣称的未来语音交互无唤醒词】 典型的为了与众不同而胡说八道。

■网友
唤醒词是用来省电的,不是“人工智能”方面有所缺失才需要唤醒,而是移动设备平时处于低能耗状态,需要专用硬件唤醒系统。这个说法意义不大。并不是什么把键盘交互比如“alt-control-del"改为语音交互这样的paradigm shift。或许说话的人并不知道其中的区别?

■网友
拿人来做比方的话,别人找你说话你怎么意识到他/她要沟通的对象是你呢?“喂”“哎”或者喊名字,人都要唤醒况且机器?人工智能可以增加唤醒词或者增加唤醒语境、况境,但是不可能无唤醒词,真的没有唤醒那就是时刻待命,不存在唤醒一说。个人觉得这是在哗众取宠。

■网友
如果百度不是在博眼球的话,他这个野心很大。
通过人在交流过程中的语境、说话的方向变化来判断是否唤醒自己,当然如果有个摄像头能判断人的手势或者是否忽然看向它,就完美了。难点是语境的判断,目前无解。

■网友
谢邀。免唤醒国内已经有公司方案实现了。不合适展开来回答,搜索一下讯飞免唤醒就是了
■网友
非常明显,跟省电没有关系,主要是addressee detection做不好,所以要加唤醒词。另外回答这个问题,无唤醒词确实是趋势,大概30年后实现吧。
■网友
人在美国读书,有时候跟印度队友聊天总是记不住名字。所以只能看着他说话,来表示在跟他说话。我不知道这样有什么方便的。
■网友
本来就可以不用唤醒词,现在很多交互机器人保留唤醒一是为了省电,二是为了提高asr识别效率。


    推荐阅读