[lucene] concept
2020-03-05 本文已影响0人
cdz620
the core of indexing classes
imageIndexWriter
管理index 的documents,包括adds, removes, or updates documents
Directory
- lucene 存放index的地方。由IndexWriter写入index。
- 相当于云存储,支持多种类型Directory,和自定义的Directory
Analyzer
接收document解析,确定需要index的内容,产生stream token。
Document
- lucene基本数据类型,从其他方式获取的数据都将转化成Document。
- Document 代表Fields的集合
Fields
- 代表源数据的“metadata”,
- name 关联value,当有同样的name存在时,value被appended
the core searching classes
IndexSearcher
用户搜索类,提供搜索方法
Term
- 搜索的基本单元
- 结构类似Field,name value结构
Query
查询类,根据不同的查询类型有不同的查询方法:TermQuery,BooleanQuery, PhraseQuery, PrefixQuery, PhrasePrefixQuery, TermRangeQuery, NumericRangeQuery, FilteredQuery, and SpanQuery
TopDocs
指针容器,保存搜索结果的top N 条记录。