|语音交互:先从麦克风阵列聊起( 三 )


还有就是像军工领域 , 航空航天 , 这些高端产品 , 就可以考虑使用分布式阵列了 , 这个不在我们考虑的范围内了 。
最后就是参考成本以及研发速度 , 进行选择 。 看了上面这么多介绍 , 只需要根据自己产品的售价 , 以及这方面的预算 , 相信大家都已经清楚该怎么做出选择了 。 至于研发速度 , 个人觉得选择成熟的方案是最快捷的方式 , 如果ID设计不兼容 , 可能也需要定制 , 看具体需求 。
一般像我们把手机拿到嘴边的语音交互 , 单个麦克风就够用了 , 就像有人在你耳旁说悄悄话 , 一个耳朵就能听清楚 。 但是在面对远距离 , 嘈杂环境的语音交互 , 麦克风阵列相对于单个麦克风有很明显的优势 。
五、行业内麦克风阵列介绍
我们盘点一下业内常见的产品在麦克风阵列上的使用情况
|语音交互:先从麦克风阵列聊起
本文插图

通过收集素材 , 发现小米和天猫的音箱产品线覆盖非常全 , 其中2麦到6麦的产品都有 。 其实大部分音箱设备还是采用2麦和6麦的方案 , 随着前端算法的进步 , 未来需要的麦克风可能会越来越少 。
六、如何测试麦克风阵列?
评价一个麦克风阵列的优劣 , 除了麦克风阵列的软硬件能力 , 还需要结合ASR的识别效果一起进行评估 , 以最终的识别结果为准 。
我们后面聊到ASR识别的时候 , 再聊这部分内容 。
七、总结
在语音交互普及的今天 , 消费级麦克风阵列主要解决远场景交互的语音识别问题 , 保证真实场景下的语音识别率 。
麦克风阵列主要从两方面来实现物理音频的获取 , 一方面是硬件的麦克风数量和布局 , 一方面是软前的前端算法 。 硬件布局越合理 , 麦克风数量越多 , 前端算法可以处理的信息越多 , 识别的效果越好 。 如果只有1个麦克风 , 无论前端算法再怎么牛逼 , 是无法实现声源定位的;如果有2个麦克风阵列 , 前端算法如果超级牛逼 , 是可以实现大概的声源定位;如果有6+1麦克风阵列 , 前端算法就可以轻松的实现声源定位 。
麦克风阵列只是语音识别的一部分 , 其麦克风布局和数量决定下限 , 前端算法决定上限 。
本文由 @我叫人人 原创发布于人人都是产品经理 。 未经许可 , 禁止转载
【|语音交互:先从麦克风阵列聊起】题图来自Unsplash , 基于CC0协议


推荐阅读