脑极体|AI 晨曦,一声“小度”唤醒的

嗨 , 需要一位助理吗 , 出门提醒日程 , 郁闷时陪你聊天 , 繁忙时帮你辅导孩子学习 , 或者听令为你指挥家里智能设备工作的那种?
打开招聘网站 , 这样事无巨细的"私人助理"往往只有企业高管才有资格配备 , 并且需要支付不菲的薪酬 。 如果十年前 , 我说人人都能以几百甚至几十元的成本拥有一位私人助理 , 你可能会嘲笑我痴人说梦 。 但今天 , 我想没有人会质疑语音助手对普通人生活带来的改变 。 "能逼逼绝不动手" , 早已融入我的日常习惯 。
作为人工智能领域一个极具门槛的关键技术 , 语音交互是如何被赋予了"个人助理"这一现实角色的呢?
有一个可能会被记入中国人工智能发展史册的特殊节点 , 那就是2015年 。
此前 , 早在国家863智能计算机项目当中 , 语音识别研究就被列为研究课题之一 。 但这都是学术界的事 , 普通人怎样才能感受到语音技术的魅力?
百度创始人、董事长兼CEO李彦宏与百度CTO王海峰2013年有过一番探讨 , 一致认为搜索的下一个入口是语音 。 但用户需要的不是冰冷的技术名词 , 而是可知可感的产品 。 所以问题又来了——语音能做什么?
最终 , 2015年的百度世界大会上 , 李彦宏给语音技术下了一个定义——秘书 。 "度秘"问世 , 这也是今天我们熟悉的"小度助手"的前身 。
脑极体|AI 晨曦,一声“小度”唤醒的
文章图片
提到这样一段往事 , 是因为此后从度秘到小度的每一点进化 , 其实都围绕着当初"让语音成为秘书"这样的一个愿景所延展的 。
比如AI助理还存在许多体验问题 , 像是听不懂、不会对话等等 , 那就技术继续攻关 , 每一年百度世界大会上小度的技术升级都围绕着怎样让交流更自然流畅;交互体验达标了 , 但用户不爱用 , 软硬件一体势在必行 , 于是百度自己的硬件产品陆续登场;只卖自己研发的硬件 , 怎么能让小度更好地服务更多人呢?那就广发英雄帖 , 用开放姿势吸引更多开发者与厂商加入 。
……
不难发现 , "AI语音助理"是一个极为复杂的跑道 。 技术的 , 硬件的 , 营销的 , 供应链的……各种因素掺杂其中 , 成为阻挡在它升职路上的绊脚石 。 这条路连"老大哥"谷歌或亚马逊都没有跑通 , 小度一跑就是五年 。
而观察小度的"升职路" , 也是透视百度AI成长的一个缩影 。 所以在2020年百度世界大会的特殊日子 , 我们不妨以小度的成长作为引线 , 来探寻百度AI产业智能化的往昔与今朝 。
2015 , 度秘源起 ,
为语音助理注入"个人秘书"的灵魂
为什么哲学家和看门大爷们都喜欢灵魂拷问——你是谁?从哪儿来?到哪里去?——因为可以快速从复杂的细枝末节中抽离出本质逻辑 。
先回到小度的"入职"时刻 , 来看它是如何从AI的"至暗时刻"里一步步蓄力 , 迎来黎明的 。
前面我们提到 , 秘书——是百度为AI语音助手设想的第一个、也是终极定位 。 这一"人设"显然不是拍脑袋决定的 。
早在2011年 , 苹果iPhone4S发布 , 个人手机助理Siri诞生 , 被看做是人机交互的新篇章 。 也是在差不多时期 , 李彦宏与王海峰在探讨搜索的下一代形态时 , 也一拍即合看中了语音交互的潜力 。
理由也很简单 , 信息大爆炸时代 , 语音能最大限度地降低用户的检索成本;同时 , 相比文字输入 , 语音是更自然的交互方式 。 于是2013年 , 王海峰就带领百度技术团队开始尝试语音产品的研发 , 在年底做出了智能耳机和音箱的工程样机 。
但在当时 , 切入语音领域还有许多底层问题需要解决 。
首当其冲就是技术层面的不成熟 。
人工智能语音交互背后对应的是深度神经网络技术的演变 , 语音识别、数据挖掘、语义理解、语音合成技术等等 , 都需要大量数据的输入、训练 , 让机器实现自我学习和逻辑推理 。


推荐阅读