知乎搜索 机制是采用啥搜索引擎,是用开源软件,还是自己写的

如果是以前,我会说:根据我3年的电商搜索引擎工作经验,以及对搜索引擎的使用情况,我推测,没有用开源的搜索引擎吧,不然怎么会出现这种莫名其妙的问题?的搜索功能是不是很弱? - 白日依山尽的回答虽然现在貌似没有了“北大”出现“东北大米”的结果,但似乎依旧没有同义词概念,我觉得作为这种高端问答社区网站,不会出现这种问题,不太像是用了开源搜索引擎框架会出现的问题。而且,没有对问题的答案进行分词索引,我copy答案的一句话,搜不到任何答案,可能的工程师把搜索条件进行了AND拼接,关键字多了就没结果,但是搜索引擎默认的会根据匹配程度进行打分排序的,也就是说,基本不会出现无结果,召回率应该很高,顶多准确率会略有下降。我觉得电商的商品搜索,可以严格按照用户的关键字搜索,没有就没有,然后重组关键字;但是问答类的搜索,应该是按照关键字的重要程度,进行匹配打分,然后排序。如果用户输入5个关键字,没有完全符合的结果,那么给出的就应该是,按照匹配度由高到低给出结果,或者给出重组关键字的结果吧,这才是一个搜索引擎应该做的事。 【搜索 机制是采用啥搜索引擎,是用开源软件,还是自己写的】 知乎搜索 机制是采用啥搜索引擎,是用开源软件,还是自己写的

而且没有所谓的关键字重组搜索(XXX搜索没有结果,我们为你找到XX相关的结果)。个人结论,可能用了搜索引擎的部分概念,可能是的工程师自己按照分词、到排表生成、查询树的生成和匹配、链表的交集并集差集、空间向量相似度计算(余弦定理)、排序而开发的。但是,肯定没用什么开源的搜索引擎,赌5毛!
■网友
赌五毛用的是Lucene!


    推荐阅读