玩转大数据计算之Kafka

2017-07-09  本文已影响0人  编程回忆录

Kafka版本:我们使用目前最新的版本:0.10.2

Kafka架构
Kafka是由LinkedIn开发的一个分布式的消息系统,使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用。

Kafka相关概念

常见的Kafka部署结构

kafka-1.png

如上图所示,一个典型的Kafka集群中包含若干Producer(例如广告投放服务记录的广告日志),若干broker(Kafka支持水平扩展,一般broker数量越多,集群吞吐率越高),若干Consumer Group,以及一个ZooKeeper集群。Kafka通过Zookeeper管理集群配置,选举leader,以及在Consumer Group发生变化时进行rebalance。Producer使用push模式将消息发布到broker,Consumer使用pull模式从broker订阅并消费消息。

Kafka安装

kafka-2.png ![kafka-4.png](https://img.haomeiwen.com/i3007211/410ed5a157a78e82.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
bin/kafka-server-start.sh config/server.properties &
kafka-5.png

我们可以使用lsof命令检查一下Kafka服务端口有没有正常启动:

lsof -i:9092
kafka-6.png

9092是Kafka进程的默认占用端口。

bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic ad_log
kafka-7.png
上一篇下一篇

猜你喜欢

热点阅读