关于2017-06-16 kafka集群异常问题定位

2017-06-16  本文已影响0人  LancerLin_LX

问题定位

查看监控后,发现kafka集群在2017-06-16 16:50分发现 java_log_topic和php_log_topic出现异常
定位后发现今天的数据量涨幅比较大

  1. kafka集群相关指标
  1. 服务器相关指标

1.kafka集群相关指标图

每秒的条数

image.png

每秒的输入(单位M)

image.png

每秒的输出(单位M)

image.png

2.服务器带宽指标

10.10.16.18

image.png

10.10.16.19

image.png

10.10.16.20

image.png

问题总结

kafka集群的千兆网卡带宽已经对集群造成瓶颈,带宽的瓶颈导致replication同步以及kafka与ZK通信异常等问题。
需要计划改用万兆网卡

上一篇 下一篇

猜你喜欢

热点阅读