知乎搜索 机制是采用啥搜索引擎,是用开源软件,还是自己写的
如果是以前,我会说:根据我3年的电商搜索引擎工作经验,以及对搜索引擎的使用情况,我推测,没有用开源的搜索引擎吧,不然怎么会出现这种莫名其妙的问题?的搜索功能是不是很弱? - 白日依山尽的回答虽然现在貌似没有了“北大”出现“东北大米”的结果,但似乎依旧没有同义词概念,我觉得作为这种高端问答社区网站,不会出现这种问题,不太像是用了开源搜索引擎框架会出现的问题。而且,没有对问题的答案进行分词索引,我copy答案的一句话,搜不到任何答案,可能的工程师把搜索条件进行了AND拼接,关键字多了就没结果,但是搜索引擎默认的会根据匹配程度进行打分排序的,也就是说,基本不会出现无结果,召回率应该很高,顶多准确率会略有下降。我觉得电商的商品搜索,可以严格按照用户的关键字搜索,没有就没有,然后重组关键字;但是问答类的搜索,应该是按照关键字的重要程度,进行匹配打分,然后排序。如果用户输入5个关键字,没有完全符合的结果,那么给出的就应该是,按照匹配度由高到低给出结果,或者给出重组关键字的结果吧,这才是一个搜索引擎应该做的事。 【搜索 机制是采用啥搜索引擎,是用开源软件,还是自己写的】
而且没有所谓的关键字重组搜索(XXX搜索没有结果,我们为你找到XX相关的结果)。个人结论,可能用了搜索引擎的部分概念,可能是的工程师自己按照分词、到排表生成、查询树的生成和匹配、链表的交集并集差集、空间向量相似度计算(余弦定理)、排序而开发的。但是,肯定没用什么开源的搜索引擎,赌5毛!
■网友
赌五毛用的是Lucene!
推荐阅读
- 为啥知乎上普便有一种【我在北上广深打工,所以拥有更好的视野】这样的错觉
- 知乎有没有必要增加一个特别关注功能
- python 爬虫,咋获得输入验证码之后的搜索结果
- 唯品会无搜索模式真的能让大众消费者驻留页面更长时间吗
- 知乎上关于人生经验的介绍是否可能对青少年造成潜在危害
- 怎样制作一个简易的信号干扰器
- 像知乎豌豆夹这种新兴互联网公司发展的实际状况咋样
- 只看报纸、杂志、知乎、微博等文字而很少阅读书籍的人,和喜欢看书的延迟接受信息的人,哪种会比较优秀呢
- 《亿万》第九集里,法官用的这个搜索引擎是啥
- 315晚会为啥不提知乎买粉的那些人