Kafka

kafka消息发送注意事项

2019-05-20  本文已影响33人  裘马轻狂大帅
多consumer并发消费消息时,容易导致消息乱序,通过限制消费者为同步,可以保证消息有序,但是这大大降低了程序的并发性。

    kafka通过partition的概念,保证了partition内消息有序性,缓解了上面的问题。partition内消息会复制分发给所有分组,每个分组只有一个consumer能消费这条消息。这个语义保证了某个分组消费某个分区的消息,是同步而非并发的。如果一个topic只有一个partition,那么这个topic并发消费有序,否则只是单个partition有序。

一般消息系统,consumer存在两种消费模型:

push:优势在于消息实时性高。劣势在于没有考虑consumer消费能力和饱和情况,容易导致producer压垮consumer。

pull:优势在可以控制消费速度和消费数量,保证consumer不会出现饱和。劣势在于当没有数据,会出现空轮询,消耗cpu。

kafka采用pull,并采用可配置化参数保证当存在数据并且数据量达到一定量的时候,consumer端才进行pull操作,否则一直处于block状态。kakfa采用整数值consumer position来记录单个分区的消费状态,并且单个分区单个消息只能被consumer group内的一个consumer消费,维护简单开销小。消费完成,broker收到确认,position指向下次消费的offset。由于消息不会删除,在完成消费,position更新之后,consumer依然可以重置offset重新消费历史消息。

消息发送语义

producer视角

消息最多发送一次:producer异步发送消息,或者同步发消息但重试次数为0。

消息至少发送一次:producer同步发送消息,失败、超时都会重试。

消息发且仅发一次:后续版本支持。

consumer视角

消息最多消费一次:consumer先读取消息,再确认position,最后处理消息。

消息至少消费一次:consumer先读取消息,再处理消息,最后确认position。

消息消费且仅消费一次。

上一篇 下一篇

猜你喜欢

热点阅读