蓝鲸财经Daniel Povey：Kaldi 核心算法K2 0.1版本已发布，未来将坚持开源

【蓝鲸财经Daniel Povey：Kaldi 核心算法K2 0.1版本已发布，未来将坚持开源】北京联盟_本文原题：Daniel Povey：Kaldi 核心算法K2 0.1版本已发布，未来将坚持开源

本文插图
蓝鲸TMT频道11月15日讯，在第五届Kaldi技术交流会上， Kaldi之父Daniel Povey博士与来自北京各大互联网公司、知名高校的开发者们深入交流下一代Kaldi社区未来的发展。
Daniel Povey博士目前担任小米集团语音首席科学家，由他开发和维护Kaldi 集成了多种语音识别模型，是业界语音识别框架基石。加入小米一年， Daniel Povey设计并开发出了新一代Kaldi 。新一代Kaldi分成三个部分，包括核心算法部分，训练数据准备部分、示例脚本集合部分。
据介绍，其中， Lhotse（训练数据准备部分）将替代以前Kaldi中所有数据准备相关的工作，操作各种音频和文本的元数据。 Lhotse除了Kaldi本身，也适用于其他应用。而且Lhotse纯Python代码，方便易用。
Icefall（示例脚本集合部分）将代替Kaldi中的示例脚本集合，并独立成为一个单独的子项目。之所以要把示例脚本集合与核心算法分开，是考虑到示例脚本可能会非常庞大，且经常变动。
新一代Kaldi的核心部分叫“k2” 。 k2可以让开发者很容易在PyTorch/TensorFlow中实现各种语音识别相关算法，比如CTC、LF—MMI、RNN—T、2nd—pass语言模型等，消除以往语音识别算法中训练跟解码不匹配的问题。同时，通过k2可以实现（置信度逐渐提高的）多轮解码过程。
Daniel Povey博士透露， k2核心代码已完成。约41000行代码（主要是C++），本周刚发布0.1版本。他在本次线下活动中强调：“今天有太多人依托Kaldi在做自己的事业，有很多人为Kaldi社区一直在做贡献， Kaldi会始终坚持开源。 ”
小米集团副总裁、技术委员会主席崔宝秋指出，拥抱开源是小米工程文化的重要组成部分。崔宝秋在接受蓝鲸TMT采访人员专访时表示， Kaldi的一些语音技术与代码已经在一些小米的产品线使用，未来其语音技术将在小米的手机、音箱、电视以及更多智能家居与智能穿戴设备中使用，小米非常重视语音技术。

蓝鲸财经Daniel Povey：Kaldi 核心算法K2 0.1版本已发布，未来将坚持开源

推荐阅读

找工作平台哪个靠谱？

「羊羽spy」神舟笔记本居然只需59元到手？进来教你如何使用京东漏洞下单！

儿童饮食|秋季，常给家人吃这菜，2元一斤，保护眼睛，孩子近视更要吃

关于古茶树的鲜嫩记忆,穿越原始森林的爱恋

「低价股」中国股市：A股会跌回2400点？如果手中有15万资金，低吸5元以下低价股能赚钱吗？

夜光水杯能过安检吗夜光水杯能过安检吗吗

|辽宁队最稳定球员是他！33岁韩德君统治内线：命中率第2，篮板第4

生活要酷资讯号|realme销量不如老人机品牌，降价1000没人买，618销量排行榜

茶叶加盟店选址的原则,鹭岩茗茶广西北海茶叶加盟店盛大开业

「榨苹果汁」带籽的榨苹果汁会引起中毒如何正确给宝宝添加果汁

悟诗词闻茶香广西昭平探访八桂有机茶之路

智通财经潍柴动力(02338)：蒋彦及余卓平获提名为独立非执行董事

绿萝不是单一品种，这6种漂亮的绿萝，叶子有花纹皮实又好养

新疆新增本地确诊5例究竟怎么回事？新疆新增本地确诊5例背后的真相

驾驶|河北交警不系安全带被骑手训斥后被调离执法职务

人民网|太有爱！老奶奶半蹲为朋友拍照，网友纷纷@闺蜜

【】南海热带低压可能于31日生成海南岛将迎来较强风雨

新氧美容APP@网红没文化有多可怕，为卖货吹嘘产品获得“诺贝尔化妆学奖”？

走亲访友的过程中，怎么样和中老年的以及其他没有太多共同话题的亲友聊得很投入

检方回应女子被同行男子下药■检方回应女子被同行男子下药