ElasticSearch | 聚合分析的原理 & 精准度的问题

2020-05-28  本文已影响0人  乌鲁木齐001号程序员

分布式系统的近似统计算法

分布式系统的近似统计算法.png

min 聚合分析的执行流程

Terms Aggregation | 返回参数中的 2 个特殊值

Terms Aggregation | 执行流程

Terms 聚合不正确的案例

Terms 聚合不正确的案例.png
doc_count_error_upper_bound | 举例分析
sum_other_doc_count | 举例分析

解决 Terms 聚合不准的问题 | 提升 shard_size 的参数

Terms 聚合分析不准的原因
解决方案 | 1
解决方案 | 2

参数 | shard_size | 设定

通过调大 shard_size 的大小,使得 doc_count_error_upper_bound 的值降低,从而提升准确度,其原理是:增加整体计算量,提高精准度的同时会降低响应时间;

shard_size 默认大小
上一篇 下一篇

猜你喜欢

热点阅读