语音|贾磊畅谈AI语音技术的现在、过去和未来

在国内 , 谈到智能语音技术 , 肯定绕不开一个人 , 那就是现任百度语音首席架构师贾磊 , 他是智能语音界举足轻重的AI大牛 , 于2010年加入百度 , 组建了百度语音团队 , 主导研发了百度语音识别和语音合成等一系列百度自有知识产权的语音核心技术 。 2016年短暂创业后又回归百度 , 主持研发了小度智能音箱的远场语音交互系统、小度车载语音交互、百度鸿鹄语音芯片、百度智能语音呼叫中心系统等一系列百度语音类产品并将相关技术推向中国社会 , 他还于2015年获得了全国劳模称号(互联网业首位全国劳动模范) 。
作为 AI 落地的一个关键组成部分 , 智能语音交互技术这一路是如何发展起来并日趋成熟的?在2020魔幻的一年 , 智能语音技术的最新发展是什么?伴随着5G、AI算力等技术的快速发展 , 未来智能语音技术又将在哪些方向进行突破和创新?本文将分为上下两部分 , 结合贾磊的从业经历 , 从个人侧和技术侧详谈智能语音技术的过去、现在和未来 , 肯定能让你收获颇多 。 另外 , 贾磊也将于2021年1月8-9日QCon北京站上带来智能语音的更多精彩分享 , 欢迎大家现场面基 , 共同探讨、交流 。
(上)
作为最早关注智能语音的业界大咖之一 , 贾磊是在什么契机下选择走上智能语音之路的?他对语音交互认知的本源是如何理解的?短暂创业经历又给他带来了哪些收获?接下来 , 本文上篇将你深入认识一下贾磊 , 全面了解下大牛成长记 。
兴趣驱动 , 开启近20年的智能语音技术追求之旅
贾磊选择语音是兴趣驱动的 。 贾磊硕士毕业后 , 考入中科院自动化所攻读博士学学位 。 他最初的研发方向是图像处理 , 广泛涉猎了模式识别各学科方方面面的知识 , 也综合比较了图像、语音和NLP等学科的学科差异等 。 这时候逐渐开始对语音技术产生了浓厚的兴趣 , 很好奇人是怎么发出声音、感知声音、并且理解声音内容的 。 当时IBM的ViaVoice软件也是风靡世界 , 人们依靠声音来实现人机交互的梦想的实现就摆在眼前 , 语音产业化应用的明天一片大好 。 这时候正巧贾磊中科院自动化所的第一任导师因为工作调动问题 , 允许他们调换专业 , 最终他根据个人兴趣发展 , 申请从图像处理方向转到语音识别的技术方向上 。 从那时候开始 , 贾磊就开始了他近20年的语音技术追求之旅 。
短暂创业让贾磊明白了伙伴间的“可依赖”关系
贾磊曾在2016年有过一段短暂的创业经历 , 谈及创业带给他的最大收获 , 贾磊坦言 , 创业使他懂得了创业伙伴之间需要的是“可依赖” , 而不是简单的“可信赖” 。 大家因为信赖走到一起 , “信赖”只是彼此结缘的开始 。 创业伙伴们之间需要维护的是一种可依赖关系 , 这种关系需要长期存在 , 是一个过程 。 创业过程中 , 经常舍死忘生 , 人力物力财力都有限 , 大家各自需要 120% 的投入解决眼前的问题 。 大家需要把后背交给对方 , 无条件的信任对方 。 大家背靠背的去战斗 , 背靠背的一起拼 。 每个人都拼死守住自己前方的战场 , 把自己的后背托付给一起创业的伙伴和兄弟 。 一个人败了 , 其实也是大家都败了 , 再说谁的责任已经毫无意义 。 创业会让人更加认识到团队协作的价值和团队的作用 。 除了对创业伙伴之间的关系理解外 , 创业带给贾磊最大的冲击是对资本的敬畏 。 之前一直在大公司打工做技术 , 从来没有意识到资本对于技术发展的可持续是如此的重要 。 经过创业之后 , 他深刻的理解到 , 技术要想有进步 , 不单单是技术人员的个人努力 , 更重要的是技术人员所属平台的持续长期投入 。 这些投入不单单是技术人员的工资、实验以及各种研发要件的投入 , 更为具体的是技术应用场景的投入 , 后者的投入更为巨大 。 因此创业之后再回到百度 , 贾磊更加感恩 , 百度的长期不计回报的投入 , 才让语音技术这个小草 , 在百度内能够长成参天大树 。 贾磊个人也从语音技术的普通专业技术人才 , 变成语音行业的技术领军人物 。


推荐阅读