13、你们公司生产环境的分布式搜索引擎是怎么部署的呢?
2018-12-22 本文已影响64人
db41bbeed50c
1、面试题
es生产集群的部署架构是什么?每个索引的数据量大概有多少?每个索引大概有多少个分片?
2、面试官心里分析
这个问题,包括后面的redis什么的,谈到es、redis、mysql分库分表等等技术,可以说是面试中的亮点!就是你生产环境咋部署的?说白了,这个问题没啥技术含量,就是看你有没有在真正的生产环境里干过这事儿!
有些同学可能是没在生产环境中干过的,没实际去拿线上机器部署过es集群,也没实际玩儿过,也没往es集群里面导入过几千万甚至是几亿的数据量,可能你就不太清楚这里面的一些生产项目中的细节。
如果你是自己就玩儿过demo,没碰过真实的es集群,那你可能此时会懵,但是别懵。但是这里我还是建议提前做一下准备,有些东西还是要会的。
3、面试题剖析
其实这个问题没啥,如果你确实干过es,那你肯定了解你们生产es集群的实际情况,部署了几台机器?有多少个索引?每个索引有多大数据量?每个索引给了多少个分片?你肯定知道!
下面我简单的举个例子,供大家参考:
(1)es生产集群我们部署了5台机器,每台机器是6核64G的,集群总内存是320G
(2)我们es集群的日增量数据大概是2000万条,每天日增量数据大概是500MB,每月增量数据大概是6亿,15G。目前系统已经运行了几个月,现在es集群里数据总量大概是100G左右。
(3)目前线上有5个索引(这个结合你们自己业务来,看看自己有哪些数据可以放es的),每个索引的数据量大概是20G,所以这个数据量之内,我们每个索引分配的是8个shard,比默认的5个shard多了3个shard。
基本上是这样一个情况。