Elasticsearch实战 使用相关性进行搜索
2019-03-18 本文已影响0人
二次元日系控铲屎官
一、Elasticsearch的打分机制
Elasticsearch使用了被搜索词条的频率以及他有多常见来影响得分。简单的解释是,一个词条出现在某个文档中的次数越多,它就越相关,但是如果该词条出现在不同文档的次数越多,它就越不想关。这一点被成为TF-IDF。TF=term frequency,IDF=iverse document frequency
Lucene评分公式给定查询q和文档d,其得分是查询中每个词条t的得分总和,而每个词条的纷纷是该词在文档d中的词频的平方根,乘以该词逆文档频率的平方和,乘以该文档字段的归一化因子,乘以该词的提升权重
综上所属,词条的词频越高,得分越高;相似的,索引中词条越罕见,逆文档频率越高。