PMCAFF产品经理语音交互优势场景产品设计

本文插图
语音交互逐渐在更多的场景里替代可视化交互，或者赋能可视化交互。上世纪80年代语音交互技术就出现在计算机里了，为什么好像最近几年才真正走入大众的生活中？其实语音交互的发展经历了三个阶段。第一阶段是上世纪80年代，语音交互能够实现一问一答，但不能理解上下文，不能连续对话。随着人工智能深度学习算法的发展，计算机语义理解的能力越来越强，大约在2009年的时候，随着siri的出现，进入第二阶段，能有问有答，能够理解上下文，但是这种应用场景还不太普及。第三阶段， 2014年AmazonEcho的出现，实现了应用的革新，拓展了远场交互的场景， 2017年的时候智能音箱的快速发展才使得语音交互的方式才逐渐走入大众的视野。
语音交互的技术的实现包括三个环节：听（ASR）、语义理解（NLP）、和说（TTS）。
听：把语音识别成文字，用的是ASR技术。
语义理解：把文字输入转化为文字输出。通过语法判断、上下文理解、关系理解、知识图谱等技术。就是理解文字的含义后，把想反馈的回答以文字表达出来，使用NLP技术。（把流程和技能归到这一环节）
说：把文字合成为语音，用的是TTS技术。
相比于成熟的可视化交互，语音交互的场景还有许多可以挖掘的方面。相比于可视化的交互，哪些场景下人们更倾向于语音交互呢？本文从不同语音交互动机进行分析，探讨一下语音交互的产品设计。
首先，语音交互的场景很多，在不同的场景下，人们使用语音交互的动机大致可以归纳为以下四种：
更快：省去信息填写、省去界面操作等
更轻便：更轻的硬件携带成本
学习成本更低：相比可视化更贴合用户使用习惯
被动信息获取成本更低：信息触达用户的方式更高效
以下详细分析一下这四种动机的场景和产品设计。
1.更快
语音交互主要使用动机之一是快。可视化交互把许多复杂的业务缩短到了几分钟以内，而语音交互进一步把几分钟的流程缩短为秒的级别，因为人说一句话大概也就3-20秒吧。这也是语音交互在应用中的主要优势，场景举例：
小N感觉身体有点不舒服，想去医院看一下，打算先预约挂号。
方案一：在手机上找到预约的app ，按流程进行预约。找到想去的医院、选择科室、选择日期、选择或输入自己的医保卡等信息，然后确认挂号预约并支付。
方案二：对语助说， "爱同学，帮我预约某某医院后天上午内科的普通挂号" ，语助完成任务后，回复"已预约后天上午某某医院的内科的普通挂号，请在机上确认付。 "
在这个场景中，图形界面流程与语流程的对：

本文插图
很明显， AI的语义理解能力把"查找和选择"的行为高效地代劳了，原本界面操作要花去5-10分钟的事情，语音交互用几十秒完成了。哪些情况下语音交互能体现出这种高效性？在用户熟悉、高频、复杂流程的场景中能体现，比如点餐、购物、出行等。
语音交互的快速性还会在以下几个方面中体现出来：
数据存储
语音的信息录入门槛高，所以从效率自然发展的角度来说，要么减少录入次数，要么加速录入过程。因为"更快"这种动机容易出现在高频场景，所以比起加速录入，减少录入次数是更明智的选择。既然要减少录入次数，那么信息就必须录入后存储起来，所以语音交互的用户信息存储量有增大的趋势。而且随着用户信息存储量的增加，语音交互的效率提升会越来越明显， "快"的优势就会发挥出来。所以，数据存储在用户语音交互"更快"上会发挥重要作用。

PMCAFF产品经理语音交互优势场景产品设计

推荐阅读

胫骨筋膜炎怎么办？

北京青年报|140万张北京消费券9月8日发放

科技信息中心懂手机的人都这样选，20年购机避不开的2大刚需

鸡冠花泡水喝治什么病,栽种鸡冠花要注意什么

健身励志录才能享受人生。只要用心感受，幸福就会永远存在，人有个好的心态

68岁洪金宝与友人聚餐 68岁洪金宝与友人聚餐身体突然暴瘦

电动车掌中宝电动车劲敌出现？电动车将会被取代？你怎么看？

「网文圈」原创腾讯嫡系接管阅文，网文新时代已经到来

"Go City 旅城"旅行景点通票微信小程序上线解锁新加坡自由行掌上旅游新姿势

纳西姆|男子自称先知遭控渎神，巴基斯坦受审遭当庭枪杀，凶嫌：梦中人指使

才友军事▲太平洋仅剩下一艘航母编队，世界目光转向东方，这次已不是美军

【金牛座】6月3号喜事不断，福运天降，运势顺风顺水，钱财不愁的3生肖

如何起诉离婚(如何起诉离婚？)

保安|漫展“保安女”道歉后，网友爆出其生活照，真人比cos狂三好看很多

情暖童心关爱留守儿童的美篇?关爱留守儿童美篇分享

ZAKER生活|并出现美国雇佣兵，如何杜绝99年悲剧重演？，塞尔维亚爆发骚乱

天猫天猫618启幕，1000万95后在“520告白季”“报复性表白”

想给父母做个全身检查，在北京哪个体检中心比较好点

名片设计卡片设计

北晚新视觉网：美国曾拒绝中国物资，我们需要热脸贴冷屁股吗？，全球疫情肆虐