根据语音来搜索语音,目前的技术可行吗有难点吗有应用前景吗

可行。先讨论以语音搜索语音。这种搜索可能有两种目的,一种是寻找与给定语音片断在信号层面上相似的语音,另一种是寻找与给定语音片断在内容上相似的语音。前一种已经有一些应用了,主要是哼唱检索,例如SoundHound。它的实现方法,主要是从语音片断中提取特征,表示成一个高维向量(“声纹”),然后在数据库中进行模糊匹配。后一种一般还是要先把语音识别成文本,转化为用文本搜索语音的情况。用文本搜索语音,主要还是依赖语音识别技术。一般的方法就是把语音数据库识别成文本并建立索引,然后在其中搜索关键词。与纯文本搜索相比,由于语音识别的结果具有相当的不确定性,所以索引中必须存储各种可能的识别结果以及它们的可靠程度。在检索时,对于每个匹配,都要根据索引中存储的可靠程度来打分,排除掉一些不太可能的匹配,并对比较可能的匹配进行排序。我觉得文本搜索语音还是大有用武之地的,比如像TED、MOOC这些讲座网站,用户会有“寻找演讲者说了某些话的段落“这一需求。只是我目前还没有见过这方面的应用。
■网友
这个已经比较容易实现了。有人管这个叫音频DNA检索,可以用来检索相同片段。算法比较容易,十多年都没有太多进展了。
■网友
语音搜索语音,具体目标是什么?哼唱检索,可以算一类应用。另外,比如我想搜索Obama的所有演讲,这是一类;再有,想搜索所有与某个话题或者事件相关的音频。这个还真是比较难。


    推荐阅读