关于ElasticSearch搜索效果的问题分析( 二 )

  • 权重
  • 权重由三个因素决定:词频、逆向文档频率、字段长度归一值
    • 词频
    • 逆向文档频率
    • 字段长度归一值
  • 向量空间模型通常我们都是搜索多个字段 , 这样就需要合并多词权重 , 这个由向量空间模型实现 。 具体合并过程基本都是数学上的算法 , 没有详细研究 , 有兴趣的小伙伴可以到网上找一下 。

  • 推荐阅读