大数据组件知识点总结(5) - Kafka

2018-08-22  本文已影响59人  千反田爱瑠爱好者

基本架构

工作流程:

Producer

Broker

Consumer

ZooKeeper

Controller

关键技术点

对比Flume

应用定位上,Kafka是通过多副本和持久化(暂存一段时间)确保数据不丢失,Flume只是确保在传输过程中出错可以恢复(Sink发送成功后数据从Channel删除)。

可靠性级别可控

Producer向Broker发送消息可设置确认应答方式控制可靠性级别。

数据多副本

复制方式

高效的持久化机制

由Broker基于offset顺序写入到磁盘

数据传输优化

可控的消息传递语义

控制消息可重复接收的次数(at most once,at least once,exactly once)

上一篇下一篇

猜你喜欢

热点阅读