PMCAFF产品经理语音交互优势场景产品设计



PMCAFF产品经理语音交互优势场景产品设计
本文插图

语音交互逐渐在更多的场景里替代可视化交互 , 或者赋能可视化交互 。 上世纪80年代语音交互技术就出现在计算机里了 , 为什么好像最近几年才真正走入大众的生活中?其实语音交互的发展经历了三个阶段 。 第一阶段是上世纪80年代 , 语音交互能够实现一问一答 , 但不能理解上下文 , 不能连续对话 。 随着人工智能深度学习算法的发展 , 计算机语义理解的能力越来越强 , 大约在2009年的时候 , 随着siri的出现 , 进入第二阶段 , 能有问有答 , 能够理解上下文 , 但是这种应用场景还不太普及 。 第三阶段 , 2014年AmazonEcho的出现 , 实现了应用的革新 , 拓展了远场交互的场景 , 2017年的时候智能音箱的快速发展才使得语音交互的方式才逐渐走入大众的视野 。
语音交互的技术的实现包括三个环节:听(ASR)、语义理解(NLP)、和说(TTS) 。
听:把语音识别成文字 , 用的是ASR技术 。
语义理解:把文字输入转化为文字输出 。 通过语法判断、上下文理解、关系理解、知识图谱等技术 。 就是理解文字的含义后 , 把想反馈的回答以文字表达出来 , 使用NLP技术 。 (把流程和技能归到这一环节)
说:把文字合成为语音 , 用的是TTS技术 。
相比于成熟的可视化交互 , 语音交互的场景还有许多可以挖掘的方面 。 相比于可视化的交互 , 哪些场景下人们更倾向于语音交互呢?本文从不同语音交互动机进行分析 , 探讨一下语音交互的产品设计 。
首先 , 语音交互的场景很多 , 在不同的场景下 , 人们使用语音交互的动机大致可以归纳为以下四种:
更快:省去信息填写、省去界面操作等
更轻便:更轻的硬件携带成本
学习成本更低:相比可视化更贴合用户使用习惯
被动信息获取成本更低:信息触达用户的方式更高效
以下详细分析一下这四种动机的场景和产品设计 。
1.更快
语音交互主要使用动机之一是快 。 可视化交互把许多复杂的业务缩短到了几分钟以内 , 而语音交互进一步把几分钟的流程缩短为秒的级别 , 因为人说一句话大概也就3-20秒吧 。 这也是语音交互在应用中的主要优势 , 场景举例:
小N感觉身体有点不舒服 , 想去医院看一下 , 打算先预约挂号 。
方案一:在手机上找到预约的app , 按流程进行预约 。 找到想去的医院、选择科室、选择日期、选择或输入自己的医保卡等信息 , 然后确认挂号预约并支付 。
方案二:对语助说 , "爱同学 , 帮我预约某某医院后天上午内科的普通挂号" , 语助完成任务后 , 回复"已预约后天上午某某医院的内科的普通挂号 , 请在机上确认付 。 "
在这个场景中 , 图形界面流程与语流程的对:

PMCAFF产品经理语音交互优势场景产品设计
本文插图

很明显 , AI的语义理解能力把"查找和选择"的行为高效地代劳了 , 原本界面操作要花去5-10分钟的事情 , 语音交互用几十秒完成了 。 哪些情况下语音交互能体现出这种高效性?在用户熟悉、高频、复杂流程的场景中能体现 , 比如点餐、购物、出行等 。
语音交互的快速性还会在以下几个方面中体现出来:
数据存储
语音的信息录入门槛高 , 所以从效率自然发展的角度来说 , 要么减少录入次数 , 要么加速录入过程 。 因为"更快"这种动机容易出现在高频场景 , 所以比起加速录入 , 减少录入次数是更明智的选择 。 既然要减少录入次数 , 那么信息就必须录入后存储起来 , 所以语音交互的用户信息存储量有增大的趋势 。 而且随着用户信息存储量的增加 , 语音交互的效率提升会越来越明显 , "快"的优势就会发挥出来 。 所以 , 数据存储在用户语音交互"更快"上会发挥重要作用 。


推荐阅读