在一段音频里怎样检索一句话出现的频率

谢谢邀请既然 ”这种音频不是识别成文字“,那么一种方法就是纯音频方面的特征匹配基于Shazam算法的高鲁棒性的特征匹配,前提是你的数据库里面已经有这句话了,将这句话提取特征,在FFT的基础上建立Constellation特征,然后生成hash-key,保存到指纹库里面,最后与测试音频进行匹配查找即可;题中”一句话“,我不清楚你是已经有了这句话的音频,还是有了这句话的文字,还是都没有,就想在线检测某一区间的音频的重复度? Li-Chun Wang, "An Industrial-Strength Audio Search Algorithm"
■网友
不清楚你这个是精确匹配还是模糊匹配。如果是特定的关键词可以采用语音唤醒技术,语音唤醒的好处就是不针对特定的人,而且可以适应不同的发音。如果要检索的片段是固定的,那么确实可以采用音频指纹技术。


    推荐阅读