会会撒娇有情感,小米语音声学技术新升级!( 二 )


说到就近唤醒 , 小米早在2018年就上线这一功能 , 截止2020年4月28日 , 分布式就近唤醒已为多设备用户累计避免约6.82亿次设备同时唤醒 , 准确率达到98% 。 近期首发上线了端云多维度结合的就近唤醒综合决策策略 , 深入加强多设备状态信息联动 , 智能判决空间信息 , 进一步提升了家庭复杂网络环境的兼容性 , 同时做到了多设备响应的唯一执行 , 大幅提升用户体验 。
会会撒娇有情感,小米语音声学技术新升级!
图片

未来 , 小米将专注于家居复杂场景应用、智能声学感知和多传感融合 。 在复杂的家庭结构环境中 , 保证算法的可用性 , 让每个设备主动感知所处的不同环境 , 根据环境完成算法自适应 , 将数据结果取长补短 , 相互融合 , 实现多维度智能感知 。
两麦阵列唤醒:两麦盲源分离降噪前端 , 双级唤醒策略支撑
小米小爱音箱Art同步支持两麦阵列唤醒技术 。 在麦克风阵列方面 , 小米采用两麦盲源分离降噪前端 , 通过盲源分离、降噪、回声消除等技术 , 在多声源的嘈杂环境、音箱自身播放音乐时 , 都能结合语音增强技术 , 消除噪音的强干扰 , 获得干净、准确的人声音频 。
会会撒娇有情感,小米语音声学技术新升级!
图片

在唤醒方面 , 为了兼顾低功耗与高性能 , 自研语音唤醒算法采用双级唤醒策略 。 低功耗待机唤醒词检测模型 , 利用子采样与共享隐含层等技术 , 减少模型资源消耗的同时保证召回率在一个较高的水平 。 高性能误唤醒检测模型 , 采用粗粒度建模单元 , 结合局部信息与长时上下文信息 , 高效抑制误唤醒 。 通过从海量数据(603138,股吧)中自动挖掘高区分度训练样本 , 再经过数据扩充技术 , 提高唤醒模型在低信噪比与小音量场景下的鲁棒性 。
小米AI实验室语音产品负责人陈君宇表示 , 小米IoT平台连接的智能硬件数已达到2.5亿台 , 音箱出货量已经达到2200万台 , 在这么大的用户体量下 , 如何让基础体验持续提升 , 且提升产品在AI体验上的创新性 , 对自研AI团队来说是非常重要的使命 。
小米一直致力于研发先进的AI技术 , 并将技术落地到产品及业务 , 为用户带来更好的产品体验 , 让全球每一个人都能享受科技带来的美好生活 。
(责任编辑:王治强 HF013)


推荐阅读