Java相关

大数据 - Kafka

2020-04-03  本文已影响0人  万福来

大数据 - Kafka

初识Kafka

Kafka是一个分布式的,支持多分区、多副本的基于zookeeper的分布式消息流平台。

Kafka术语

Kafka的特性

Kafka的消息队列

Kafka 的消息队列一般分为两种模式:点对点模式和发布订阅模式

Kafka系统架构

image.png

一个典型的 Kafka 集群中包含若干Producer(可以是web前端产生的Page View,或者是服务器日志,系统CPU、Memory等),若干broker(Kafka支持水平扩展,一般broker数量越多,集群吞吐率越高),若干Consumer Group,以及一个Zookeeper集群。Kafka通过Zookeeper管理集群配置,选举leader,以及在Consumer Group发生变化时进行rebalance。Producer使用push模式将消息发布到broker,Consumer使用pull模式从broker订阅并消费消息。

Kafka为啥这么快

Kafka 实现了零拷贝原理来快速移动数据,避免了内核之间的切换。Kafka 可以将数据记录分批发送,从生产者到文件系统(Kafka 主题日志)到消费者,可以端到端的查看这些批次的数据。
批处理能够进行更有效的数据压缩并减少 I/O 延迟,Kafka 采取顺序写入磁盘的方式,避免了随机磁盘寻址的浪费。

上一篇 下一篇

猜你喜欢

热点阅读