PMCAFF产品经理语音交互优势场景产品设计

本文插图

语音交互逐渐在更多的场景里替代可视化交互，或者赋能可视化交互。上世纪80年代语音交互技术就出现在计算机里了，为什么好像最近几年才真正走入大众的生活中？其实语音交互的发展经历了三个阶段。第一阶段是上世纪80年代，语音交互能够实现一问一答，但不能理解上下文，不能连续对话。随着人工智能深度学习算法的发展，计算机语义理解的能力越来越强，大约在2009年的时候，随着siri的出现，进入第二阶段，能有问有答，能够理解上下文，但是这种应用场景还不太普及。第三阶段， 2014年AmazonEcho的出现，实现了应用的革新，拓展了远场交互的场景， 2017年的时候智能音箱的快速发展才使得语音交互的方式才逐渐走入大众的视野。
语音交互的技术的实现包括三个环节：听（ASR）、语义理解（NLP）、和说（TTS）。
听：把语音识别成文字，用的是ASR技术。
语义理解：把文字输入转化为文字输出。通过语法判断、上下文理解、关系理解、知识图谱等技术。就是理解文字的含义后，把想反馈的回答以文字表达出来，使用NLP技术。（把流程和技能归到这一环节）
说：把文字合成为语音，用的是TTS技术。
相比于成熟的可视化交互，语音交互的场景还有许多可以挖掘的方面。相比于可视化的交互，哪些场景下人们更倾向于语音交互呢？本文从不同语音交互动机进行分析，探讨一下语音交互的产品设计。
首先，语音交互的场景很多，在不同的场景下，人们使用语音交互的动机大致可以归纳为以下四种：
更快：省去信息填写、省去界面操作等
更轻便：更轻的硬件携带成本
学习成本更低：相比可视化更贴合用户使用习惯
被动信息获取成本更低：信息触达用户的方式更高效
以下详细分析一下这四种动机的场景和产品设计。
1.更快
语音交互主要使用动机之一是快。可视化交互把许多复杂的业务缩短到了几分钟以内，而语音交互进一步把几分钟的流程缩短为秒的级别，因为人说一句话大概也就3-20秒吧。这也是语音交互在应用中的主要优势，场景举例：
小N感觉身体有点不舒服，想去医院看一下，打算先预约挂号。
方案一：在手机上找到预约的app ，按流程进行预约。找到想去的医院、选择科室、选择日期、选择或输入自己的医保卡等信息，然后确认挂号预约并支付。
方案二：对语助说， "爱同学，帮我预约某某医院后天上午内科的普通挂号" ，语助完成任务后，回复"已预约后天上午某某医院的内科的普通挂号，请在机上确认付。 "
在这个场景中，图形界面流程与语流程的对：

本文插图

很明显， AI的语义理解能力把"查找和选择"的行为高效地代劳了，原本界面操作要花去5-10分钟的事情，语音交互用几十秒完成了。哪些情况下语音交互能体现出这种高效性？在用户熟悉、高频、复杂流程的场景中能体现，比如点餐、购物、出行等。
语音交互的快速性还会在以下几个方面中体现出来：
数据存储
语音的信息录入门槛高，所以从效率自然发展的角度来说，要么减少录入次数，要么加速录入过程。因为"更快"这种动机容易出现在高频场景，所以比起加速录入，减少录入次数是更明智的选择。既然要减少录入次数，那么信息就必须录入后存储起来，所以语音交互的用户信息存储量有增大的趋势。而且随着用户信息存储量的增加，语音交互的效率提升会越来越明显， "快"的优势就会发挥出来。所以，数据存储在用户语音交互"更快"上会发挥重要作用。

PMCAFF产品经理语音交互优势场景产品设计

推荐阅读

时尚美妆妞穿粉色小香风配丝巾，挡不住阔太气质，熊黛林骨子里透着高级感

潮品汇|高颜值+全球最快闪充+全场景视频功能的Reno4打包带走，只需2999

东联社|高唐警方快速破案擒“硕鼠”，五千余元卖粮款不翼而飞

『美味食疗』两种家常菜竟是长寿药！家家都会吃到

梁洛施|梁洛施看破红尘，一辈子不嫁人了！

怎样确定自己在大学想读的专业

长沙女子开车撞宝马吓懵了，男友很镇定宝马车主也不生气，一个月后真相大白

宝宝多大可以吃肉类

笔写趣史|为何生母孝庄太后，立马将一位太监处死，顺治驾崩后

【】理想汽车赴美IPO：两年亏了40亿现在是最好时机吗？

『公安局回应郑云龙落户北京』公安局回应郑云龙落户北京，相关落户手续齐全

日本参议院选举结果揭晓修宪势力未获得三分之二以上议席

华中科技大学|668分！安徽援鄂护士在华科留影儿子高考考上

批头直柄螺丝刀又一选择——百得BD40电动螺丝刀试用及超负荷测试

穿搭|过分的穿搭虽令人厌恶，但那也只是个例，收获路人的目光不足为奇

「新甘肃客户端」暂无法左转和掉头！，注意！途经兰州新区这两条路时

媒体见面会|连台戏《雷雨》、《雷雨·后》感受穿越时空的爱恨情仇

环球网|印度破纪录了......

经济学家|民国经济学家，为一女子终生未娶，一生只做一件事

热剧天天乐|特朗普为警方辩护：99%的警察都是好人！自夸犯罪数据历史最佳