ElasticSearch-索引原理
2017-11-19 本文已影响0人
壹点零
索引分片
索引分片-水平扩展:
data:image/s3,"s3://crabby-images/4fefd/4fefdaf89a37eb24d4f0cfa16f7af75341e0b9d3" alt=""
索引分片-应对故障:
data:image/s3,"s3://crabby-images/30572/30572893b8826957a583f5e1a97632a5d4a64437" alt=""
数据路由
路由策略:
1、 路由公式:shard = hash(routing) % number_of_primary_shards
2、 默认的routing值是_id,也可以手工指定
3、 确定好主分片的数量后,永远不会改变
data:image/s3,"s3://crabby-images/4bd90/4bd9021c28e2a4068a19b48dea08e537fc9705d1" alt=""
查询与写入过程
data:image/s3,"s3://crabby-images/473c1/473c105edb152968eedf645541874be54712c0eb" alt=""
data:image/s3,"s3://crabby-images/f17f6/f17f6b3b1999dfe6e1046c5e0e909b823d1c2b91" alt=""
data:image/s3,"s3://crabby-images/2fc60/2fc6069205dd148238c8c06a93d75a3a6ff90a41" alt=""
data:image/s3,"s3://crabby-images/cd686/cd686112ef2e50e3965bd8697b463d04d355834b" alt=""
data:image/s3,"s3://crabby-images/d10da/d10da785ce94860975b344abbff4790cb0c8c452" alt=""
索引原理
1、 动态更新索引,不修改已经生成好的倒排索引,而是新生成一个段(segment)
2、 每一个段(segment)都是一个倒排索引
3、 ES另外使用一个commit文件,记录索引内所有的segment
4、 生成segment的数据是在内存的buffer中
data:image/s3,"s3://crabby-images/9103d/9103d7932cfc4b35a484ffa90183b9eb3ce27005" alt=""
data:image/s3,"s3://crabby-images/bf1eb/bf1eb4bfe62435b85f441cf232c190efdc3db909" alt=""
data:image/s3,"s3://crabby-images/f55fa/f55fa61f6635dc6c55c7740b93042bb5f3c98a20" alt=""
准实时查询原理
1、segment刷新到文件系统缓存
2、refresh_interval默认1s间隔,可以手动设置
PUT /my_index/_settings
{
"index" : {
"refresh_interval" : "30s"
}
}
3、主动调用/_refresh接口刷到缓存
POST /_refresh
POST /blogs/_refresh
4、可以使用 "refresh_interval":"-1"
禁用刷新
data:image/s3,"s3://crabby-images/65afe/65afe97839aab3891aabda40b72e5a3471b52b2b" alt=""
事务日志
data:image/s3,"s3://crabby-images/df031/df0319fcf22edc3cfd6bc5ad60ed96e702154226" alt=""
data:image/s3,"s3://crabby-images/7232c/7232c5c86a4c079e373a84c485c3c783d6505747" alt=""
data:image/s3,"s3://crabby-images/80773/807732edf8339e29c619feea3db657d67efaf06c" alt=""
data:image/s3,"s3://crabby-images/81efd/81efde779052e7a416926c3871db7b869d3233e5" alt=""
1、lunce的commit操作非常昂贵,segment从文件系统缓存刷新到磁盘,更新commit
2、translog记录发生在索引上的各种操作
3、每个不同的shard都有自己的事务日志
4、默认5秒进行一次fsync(index.translog.sync_interval)
5、默认512MB进行一次Flush(index.translog.flush_threshold_size)
6、主动调用/_flush接口
7、异步translog
PUT /my_index/_settings
{
"index.translog.durability": "async",
"index.translog.syunc_interval": "5s"
}
段合并
段合并过程:
- 过多的segment会影响数据读取的性能,占用文件句柄和内存资源
- 专门的merge线程池负责
- 手工调用接口
- 新版本_forcemerge接口
- 老版本_optimize接口
- POST /my_index/_forcemerge?max_num_segments=1
data:image/s3,"s3://crabby-images/a2f01/a2f01de462b02bac61c1978befa3818833f223f1" alt=""
data:image/s3,"s3://crabby-images/f77b5/f77b5167d02807c619da496728096c58a095336d" alt=""
段合并配置
合并线程数量:
- index.merge.scheduler.max_thread_count
- 默认值:Math.min(3, Runtime.getRuntime().availableProcessors() / 2)
合并线程的限速配置:
- 5.0之前indices.store.throttle.max_bytes_per_sec=20mb
- 5.0之后不要配置,使用了Lucene的CMS(ConcurrentMergeScheduler)的auto throttle机制
merge默认最大segment为5GB,最多同时合并10个段
forcemerge有单独的一个线程运行
索引删除与更新
在删除或更新时:
- 段(segment)是不可以改变的,不能把旧文档从段中删除,也不能修改段中的文档;
- 每个提交点包含一个.del文件,旧文档设置删除标记;
- 更新的文档写入当前开启的段;
- 此时查询,内部会将这个旧文档匹配到,但在最终结果返回时会过滤掉;
- 在后台段合并时,文档才会正在删除。
data:image/s3,"s3://crabby-images/ef489/ef489c9e2de59337f642c45b9f6b3a59ce79696c" alt=""