人工智能|清晰度提升40%,腾讯天籁AI降噪技术为听障者带来福音( 二 )
针对噪声消除 , 腾讯多媒体实验室融合了经典的数字信号处理按和深度学习的技术 。 经典的数字信号处理在处理平稳噪声上有独特的优势 , 同时计算复杂度比较低 。 但是对于日常生活中的非平稳噪声往往力不从心 。
而深度学习技术有非常优秀的特征建模能力 , 可以针对日常生活当中的各种噪声进行准确的建模 , 从而非常有效的移除生活中突发的噪声 。
但是深度学习的缺点往往在于运算量复杂 , 所以为了进一步降低运算复杂度 , 腾讯多媒体实验室采用了多种辅助训练方法 , 并把训练后的模型进一步量化处理 , 把运算复杂度有效降低 , 解决了低功耗的手机终端上运行降噪处理的难题 。
商世东表示 , 整个处理过程中 , 他们针对人工耳蜗用户常见的4类声学场景 , 在业界首次采用了基于深度学习的残差网络结构 , 在多尺度和多级别的网络架构环境之下 , 对收集到的带噪语音进一步处理 。
多尺度的架构可以帮助有效区分4类声学场景 , 而多级别的网络架构可以进一步帮助区分易于混淆的带噪语言的场景 。 经过这样的处理 , 并进行4千多小时各种场景的噪声的数据训练 , 该网络总体上取得了96.2%的场景识别准确率 , 为进一步的增强和语音处理奠定了基础 。
考虑到手机上多麦克风的节奏 , 腾讯多媒体实验室采用了以前在雷达以及智能天线领域使用的技术 , 以辅助降噪和语音的正常处理 , 有效对特定方向的语音进行针对性的加强 , 同时滤除非特定方向的干扰人声以及环境噪声 。 雷锋网
商世东表示 , 经过多种技术的整合和处理 , 他们有效提升了听障人士在各种沟通场景之下的效率 , 很好的帮助消除听障人士不想听到的声音 , 将语音的清晰度提升40% 。 雷锋网
据诺尔康实验检测数据显示 , 天籁技术与人工耳蜗结合后 , 语音识别性能大幅提升 , 平均识别率达到96.28% , 其中带噪语音识别率为93.38% , 环境噪音中声音识别率达到94.24%;在手机App中植入天籁技术 , 手机双麦阵列降噪的信噪比提升 20dB , MOS分提升了0.3-0.5 , 对于改善听障人群听觉体验有着积极效果 。 雷锋网
推荐阅读
- 新科技嗅|人工智能可以应用在哪些方面
- 行业互联网|华为在法国成立第六家研究所,将会继续提升研发能力
- 中年|我市大力提升工业固废利用水平
- 技术编程|人工智能在大视频运维中如何实现CDN硬盘故障预测?
- 无线充电|巨大提升!iPhone12支持15W无线充电,可替代有线充电?
- 新加坡|新加坡大学生人工智能创新大赛开幕式举行 星环科技提供建模平台
- 票房|大麦发布演出国庆档观察:音乐节票房同比提升113% “Z世代”成消费主力
- AI人工智能|“眼健康黑科技” AI智能眼科检测仪来了!展锐虎贲T710开发板等你来盘!
- AI人工智能|非接触式测谎分析系统应用
- AI人工智能|错题打印机喵喵机P1彩色版,学习的多种打开方式