有道词典|我和欧阳娜娜一起搞研发( 二 )
这样做的好处是,基于时长的模型可以显式地调节每一个音素的发音时长,让合成出来的单词读音更接近真人朗读的效果 。
同时,Non-Attentive模型在保持模型稳定性方面也更具优势 。
而除了模型方面的精挑细选、精细打磨,值得一提的是,网易有道AI语音算法团队此次的新明星语音新增了大量高采样率的英文女声数据,将采样率从16K提升到了24K,这就让合成语音在音质、听感和真实性方面有了进一步的提升 。
至于最终的效果如何评价,请听
私以为是欧阳娜娜本娜没错了 。
“做产品是严肃的,但技术允许试错”
从项目启动到最终上线,此次有道词典的明星语音功能升级项目,整个研发周期大概持续了一个月的时间 。
时间上看还是有点紧张,但对于研发小组的成员们来说,对于项目的兴奋感远远超过了追赶deadline带来的焦虑 。
原因很简单——几个人都是根据兴趣自愿加入到项目当中的 。
除了刘银,小组中其余几人的主要技术栈都不是语音合成 。
比如主要负责例句模型的王晓强,日常更多承担的是语音识别方向的研发工作——这与语音合成几乎可以说是一个完全相反的方向 。
甚至有一位同学,此前的学习、工作内容与深度学习完全不相关,而是传统的声学前端方向 。
毕业前,曾在多家公司有过实习经历的王晓强坦言:
这种允许跨领域的技术文化,其实是很少见的 。
对于网易有道AI本身,这样的包容度也着实可以贴上“大胆”的标签 。
要知道,作为一款家喻户晓的查词工具,有道词典是网易有道用户量规模最大的产品,哪怕是一个微小功能的改动都需要严肃对待,更不必说像明星语音这样重要的功能更新 。
但实际上,这样的包容和信任,反而给了刘银、王晓强等人更大的动力——自己选择承担的任务,就一定要做好 。
从另一个层面来看,允许研发人员跨领域进行技术交流,并实际操作落地,也促成了整个技术团队的成长——不把技术视野局限在自己的一亩三分地,在思考问题时,反而更容易激发创新的火花 。
还有重要的一点是:
在自己感兴趣的领域,有技术大佬带着飞,不仅不用交学费,甚至还有工资拿,这真是太开心了 。
如果跟网易有道AI语音算法工程师们多聊一聊,就会发现,这支技术团队总是能把研发做成一件既靠谱又欢乐的事 。
他们大都很年轻,思维活跃,性格跳脱,也更勇于创新和尝试 。但同时,从学校到职场,从旧环境到新环境,他们又能用理工科的理性思维,快速地认识到应该“做什么”、“怎么做” 。
这也反映在了一个个受到用户好评的语音功能上:能够自动进行语言检测的语音翻译功能、英语跟读打分、明星语音……
并且,他们还“上得了厅堂,下得了厨房” 。不仅能在产品层面持续推动技术落地,学术、比赛成绩也拿得出手 。比如去年,他们就曾在全球语音顶会INTERSPEECH 2020“口音英语语音识别挑战赛”上名列前茅 。
这样的个人成长,背后也反映了网易有道对人才的重视 。
有道AI语音团队负责人李庆辉就表示,一个脚踏实地的团队,应该给每个人充分的才华施展空间,而在这个空间之下,大家可以潜心钻研技术,在专注于自己侧重点的情况下,去突破个人的局限 。
而当个人的能力不断突破进步,团队本身也就自然而然会成长起来 。
人才,就是公司、团队最大的财富 。
【有道词典|我和欧阳娜娜一起搞研发】(应要求,文中所列人员均为化名)
推荐阅读
- 交通事故|亲爹醉驾出事甩锅儿子:我和儿子都是88年的
- 网易|英语口语练习利器!有道听力宝开箱图赏
- 小鹏汽车|何小鹏:2021年李想过得最舒服 我和李斌都比较困难
- 词典笔|英语、古诗文都能教学!阿尔法蛋AI词典笔X10图赏
- 疫苗|曾质疑新冠疫苗的马斯克:我和家人都已经接种了
- 词典笔|百度智能词典笔上新:一年打卡300天全额退款
- 网易|英语学习利器!有道词典笔X3s旗舰版图赏 327万海量词汇
- 机器人|机器人竟然自己偷偷生孩子?我和科学家都吓了一跳
- 电影|第34届金鸡奖提名名单公布:《中国医生》、《我和我的家乡》等争夺最佳影片
- 有道词典|网易有道:将于年底终止义务教育学科培训