大数据玩转大数据大数据

Kafka Manager实现原理与填坑

2017-02-28  本文已影响4327人  扫帚的影子
Kafka Manager 简介
  1. 集群的简单健康状态查看,包括partition分布是否均衡, leader分布是否均衡等;
  2. 通过JMX查看各种指标, 比如各个broker的网络流量和消息进出数据, 每个Topic消息的读写速度等;
Kafka Manager实现
  1. Play framework: Kafka-Mananger本质上是个Web应用, 因此使用play framework的MVC架构实现;
  2. AKKA: 用于构建高并发、分布式和容错的应用. Kafka Manager中的所有请求都使用akka来异步处理;
  3. Apache Curator Framework: 用于访问zookeeper;
  4. Kafka Sdk: 用于获取各Topic的last offset, 使用Admin接口实现各种管理功能;
  1. 获取集群中所有Topic
    使用Curator访问zk获取,并监听zk相关节点 /brokers/topics 的变化;
  2. 获取Topic的partiton, leader, replicas信息
    也是从zk获取, /brokers/topics/[topic]/partitions;
  3. 获取Topic的各partition的last offset
    使用kafka sdk发送OffsetRequest到kafka集群来获得, 这个获取的动作会被封装成Future[PartitionOffsetsCapture], 每个topic一个Future, 使用Google的LoadingCache来存储这些future, 利用LoadingCache的超时淘汰机制来周期性的创建新的Future来间隔地发送OffsetRequest获取当前最新的last offset;
  4. 获取Kafka本身管理的group的消费情况
    使用kafka sdk不断地消费"__consumer_offsets"这个topic, 来获取所有group的消费情况,关于__consumer_offsets参考 Committing and fetching consumer offsets in Kafka
  5. 获取zookeeper管理的group的消费情况
    肯定是从zk上读取, /consumers

上面的这些实现都在 KafkaStateActor.scala 这个文件里.

kafka-manager.png
Kafka Manager遇到的坑
    props.put("group.id", "KafkaManagerOffsetCache")
    props.put("bootstrap.servers", bootstrapBrokerList.list.map(bi => s"${bi.host}:${bi.port}").mkString(","))
    props.put("exclude.internal.topics", "false")
    props.put("enable.auto.commit", "false")
    props.put("key.deserializer", "org.apache.kafka.common.serialization.ByteArrayDeserializer")
    props.put("value.deserializer", "org.apache.kafka.common.serialization.ByteArrayDeserializer")
    props.put("auto.offset.reset", "latest")

props.put("group.id", "KafkaManagerOffsetCache")这句说明不管启动了几个kafka manager, 消费"__consumer_offsets"都使用同一个group.
解决方案: group.id从配置文件中读取,每个kafka manager使用不同的group id;

              case GroupMetadataKey(version, key) =>
                    val value: GroupMetadata = readGroupMessageValue(key, ByteBuffer.wrap(record.value()))
                    value.allMemberMetadata.foreach {
                      mm =>
                        mm.assignment.foreach {
                          case (topic, part) =>
                            groupTopicPartitionMemberMap += (key, topic, part) -> mm
                        }
                    }
                }

这里的record.value可能为空, 此时应作清理工作:

                  if (null != record &&                                                                                                   
                      null != record.value()) {                                                                                           
                        val value: GroupMetadata = readGroupMessageValue(key, ByteBuffer.wrap(record.value()))                            
                        value.allMemberMetadata.foreach {                                                                                               
                          mm =>                                                                                                                         
                            mm.assignment.foreach {                                                                                                     
                              case (topic, part) =>                                                                                                     
                                groupTopicPartitionMemberMap += (key, topic, part) -> mm                                                                
                            }
                        }                                                                                                                               
                        } else {                                                                                                                          
                          groupTopicPartitionMemberMap.foreach {                                                                                          
                            case ((group, topic, part), mmd) =>                                                                                           
                              if (group == key) {                                                                                                         
                                var tmp = mmd                                                                                                             
                                tmp.memberId = ""                                                                                                         
                                tmp.clientHost = ""                                                                                                       
                                groupTopicPartitionMemberMap += (key, topic, part) -> tmp                                                                 
                              }                                                                                                                           
                          }                                                                                                                               
                        }          

这里提供一种解决方案: 这个超时是Actor在执行异步请求时一直等不到返回结果造成的, 主要是前面讲过的"获取Topic的各partition的last offset的Future"没有返回结果,这些Future是通过Await.ready来阻塞拿到result的, 然而在kafka manager中这个Await.ready没有给timeout, 是一直等待, 那咱们就给个timeout好了, 代码在ActorModel.scala中, 有好几处Await.ready的调用.

找到根源: 再也不用定时重启, 提了一个pull request到官方:Use a separate thread to get the topic offsets to fixed bug 'Yikes! Ask timed out...', 主要就是不再使用 Future[PartitionOffsetCapture]来获取topic offset, 因为这个会产生大量的Future, 进而会产生大量的task提交到ThreadExcutor, 其实只需要启动一个单独的线程来作这件事就好了.

case GroupMetadataKey(version, key) =>
                   if (null != record &&                                                                                                   
                     null != record.value()) {                                                                                           
                       val value: GroupMetadata = readGroupMessageValue(key, ByteBuffer.wrap(record.value()))                            
                       var topicSet:Set[String] = Set()

                       value.allMemberMetadata.foreach {                                                                                               
                         mm =>                                                                                                                         
                           mm.assignment.foreach {                                                                                                     
                             case (topic, part) =>                                                                                                     
                               topicSet += topic
                               groupTopicPartitionMemberMap += (key, topic, part) -> mm                                                                
                           }
                         }

                         groupTopicPartitionMemberMap.foreach {                                                                                          
                           case ((group, topic, part), mmd) =>                                                                                           
                             if (group == key &&
                               !topicSet.contains(topic)) {                                                                                                         
                               var tmp = mmd                                                                                                             
                               tmp.memberId = ""                                                                                                         
                               tmp.clientHost = ""                                                                                                       
                               groupTopicPartitionMemberMap += (key, topic, part) -> tmp                                                                 
                             }                                                                                                                           
                         }                                                                                                                               
                       
                       } else {                                                                                                                          
                         groupTopicPartitionMemberMap.foreach {                                                                                          
                           case ((group, topic, part), mmd) =>                                                                                           
                             if (group == key) {                                                                                                         
                               var tmp = mmd                                                                                                             
                               tmp.memberId = ""                                                                                                         
                               tmp.clientHost = ""                                                                                                       
                               groupTopicPartitionMemberMap += (key, topic, part) -> tmp                                                                 
                             }                                                                                                                           
                         }                                                                                                                               
                       }                                                                                                                                 
               }

今天就写这么多, 其他坑以后遇到再补充.

之前一直在写kafka的源码解析,大家有兴趣也可以指正一下 源码解析

上一篇下一篇

猜你喜欢

热点阅读