AI人工智能|5G+AIoT时代:讯飞正在输入下一个十年( 二 )
文章图片
文章图片
2010年 , 讯飞AI研究院就将GMM-hmm-隐马尔可夫模型应用到语音识别系统中 , 通过运用WFST解码器 , 提高复杂的语言模型 , 达到了70%识别率 。2012年 , 讯飞又在输入法中使用了深度神经网络技术 , 把全球首个中文云识别的DNA上线到产品中 , 使得语音识别率一下子提升了到80% 。2018年, 讯飞又开始使用HybridCNN 算法 , 通过结构优化大幅提升并发路数 , 语音识别准确率突破98% 。今年 , 讯飞又在产品中加入了动态自适应编解码语音识别引擎, 进一步实现了多模态输入和领域个性化识别 。
“在这10年里 , 讯飞秉承了一个很朴素的理念 , 就是提升整个社会的效率 。”科大讯飞输入法业务总经理程坤说 。
数据显示 , 普通人打字速度一分钟60-80字 , 普通人说话速度一分钟180-240字 。如果每人每天花30分钟打字 , 语音输入至少节省20分钟 , 1年是120小时 。如果输入法能发展到1亿用户 , 每年就能节约120亿小时 。
讯飞输入法的出现 , 提高了人们输入效率 , 也改变了人们的生活方式 。
今天 , 当你拨打各大运营商、银行等客服电话 , 很多客服不是真人 , 而是机器发出的声音 , 背后运用的就是讯飞的技术;你出行中使用的打车软件、导航软件 , 导航中林志玲、郭德纲、TFBOYS等等的合成音 , 也是出自讯飞之手 。每年的国家普通话评测、中高考的口语评测 , 机器评测技术也来源于讯飞……科大讯飞以这样的方式“隐行”在无数个终端的背后 。数据显示 , 科大讯飞占据了中文语音市场70%以上的份额 。
破自己的记录 , 将个性化践行到底
2020年2月 , 全国各地的众多医生、护士驰援武汉抗击新冠疫情 。但很多人也遇到了一个小问题 , 听不太懂武汉话 。
为此 , 讯飞输入法团队经过10天的紧急技术攻关 , 上线了武汉话转普通话功能 , 并开放给广大用户 , 助力医患沟通 , 在短短的时间里 , 累计服务了3万人 。
文章图片
文章图片
方言 , 其实也是讯飞输入法团队在2011年就遇到的一个难题 。中国有太多人说的是方言 , 如果无法准确进行方言的识别 , 那么语音输入终将沦为鸡肋 。
经过用户调查和数据分析后 , 讯飞输入法选择从需求排名最高的粤语、四川话和河南话入手 。2012年的一次版本更新后 , 上线了粤语语音输入 , 成为首款支持粤语语音输入的输入法 , 紧接着上线了四川话和河南话的语音输入 。截止到目前 , 讯飞输入法的粤语语音识别准确率已经超过95% , 陆续上线了23种方言的语音识别 。
语言是很奇妙的东西 , 承载了民族和族群几千年的文化 。但如果保护不及时 , 语言消失了 , 文化也就随之消失了 。数据显示 , 世界上大约有6000 ~ 10000多种语言 , 大部分将于本世纪末消失 。
人文内容的载体 , 需要现代技术的加持 。2017年 , 讯飞输入法发起“方言保护计划”公益行动 , 通过智能语音技术保护方言;截至目前 , 方言库的珍贵语料近140万条 , 并通过A.I.语言复制实现23种方言识别 。“科大讯飞一系列核心技术的不断突破 , 有利于拓展方言保护的新方法、新思路 。”讯飞输入法业务部总经理程坤表示 。
语音识别的终极目标 , 就是让用户便利自然的输入文字或发送指令 。当语音识别率越高 , 相应的用户体验也就越好 , 社会价值就更大 。
为了用户体验的极致 , 讯飞在“个性化语音”功能上下足功夫 , 通过拓展人工智能技术 , 解决输入环境复杂、表达习惯差异、方言等问题 。
推荐阅读
- 人工智能|第二届中国超级算力大会在京举行
- 奥林巴斯|打造全景检测一站式解决方案,奥林巴斯开启全景病理新时代
- 超能网|亚马逊转用自家芯片进行人工智能训练,只剩少量程序仍然以显卡来训练
- 数评时代|相比iPhone 12 mini,低价的iPhone SE也是一种选择
- 数评时代|想在5000元档位打开局面?三星Note 20开始大幅降价
- 汽扯扒谈|加速“第三次创业”落地,长安联手华为和宁德时代组建新高端品牌
- AI人工智能|华为P50Pro:前摄屏下隐藏,麒麟芯片绝唱怒怼苹果A14
- 腾讯|腾讯举办科学脱口秀X-Talk,聚焦人工智能、基因编辑等前沿技术
- 数评时代|OPPO哪款中档手机最值?骁龙765G、强力自拍、降价百元
- AI人工智能|川渝首次联手研发7个科技创新项目