ElasticSearch - 倒排索引

2019-08-21  本文已影响0人  辻子路

Elasticsearch使用一种叫做倒排索引(inverted index)的结构来做快速的全文搜索。倒排索引由在文档中出现的唯一的单词列表,以及对于每个单词在文档中的位置组成。
我们把正排索引看作是书的目录,那倒排索引就是类似词典中单词的索引页,告诉你它在第几页:

正排索引:

文档Id 文档内容
1 blue yellow
2 yellow green
3 yellow red

倒排索引:

Term Count DocumentId:Postition
yellow 3 1:1,2:0,3:0
blue 1 1:0
green 1 2:1
red 1 3:1

倒排索引的组成

Demo:Elasticsearch

文档Id 文档内容
1 Mastering Elasticsearch
2 Elasticsearch Server
3 Elasticsearch Essentials
Doc Id TF Position Offset
1 1 1 <10,23>
2 1 0 <0,13>
3 1 0 <0,13>

ES的倒排索引

上一篇下一篇

猜你喜欢

热点阅读