Day68 Kafka 快速实战核心原理

2022-07-13 本文已影响0人小周爱吃瓜

可以实时处理大量数据，满足各种需求场景.

hadoop,hbase等.

装载到hadoop,数仓etl做离线分析和数据挖掘.

Screen Shot 2022-07-13 at 2.44.08 PM.png

消费者数量和消费分区有变化的时候。kafka会重新分配消息分区的关系，重启后分区又会归还给其他的消费者.

因为消费组无法送kafka消费消息，会对kafka的tps产生影响，比如有数百个那么rebalance会很耗时.

ISR && OSR
In Sync Replicas (所有与leader副本保持一定程度同步的副本在内组成ISR)
osd 和 leader副本同步情况滞后太多的副本组成osr.

正常情下: follower副本都应该与leader副本保持一定程度的同步.
offset偏移高低水位.

规定了一个段位的log文件最大为1g大小

一个segment可以有 index(稀疏索引，log消息体，timeindex(时间位移))

Day68 Kafka 快速实战 核心原理