kafka

老吴的学习笔记-kafka

2016-07-05  本文已影响559人  老吴学技术

kafka是啥?

全世界的消息队列都死光了吗,偏偏要学kafka?

我懂的不多,你不我骗我。要保证可靠性,消息都是要存储在硬盘上的,就硬盘那点速度,怎么可能吞吐量高?

既然这样,我让磁头不要动来动去,待在一个地方死命写不就完了?我好机智。话说这样以后卵用是否明显?

然后呢?

太草率了吧?!

如此来看,kafka对数据的“吞”入速度确实不错。不过我很好奇,如果我们服务器的硬盘很烂,又或者带宽不高,一台机器处理不过来,kafka如何扩展?

吞吐量,量只是一个方面。我想知道kafka在量上是如何保证的?

能否说细一点?

我明白了。采用pull的方式消费,那么消费者之间不会因为消费速度不一致而互相干扰。消费最快的消费者的速度不会受到任何约束。因此,kafka 对消息的量也就达到了极致。

说到消费模式,我想知道消费者是如何消费的?

说了老半天,最重要的问题给忘了。kafka中的producer、customer、partition是如何发现彼此的呢?producer怎么知道消息投递到哪些partition?consumer又是如何知道从哪些partition获取消息?

啊!~~不行了,我感到自己的知识快要溢出了!

少年且慢,还有一事相问。刚才只说了吞吐量,来说说可靠性吧!

请说重点。producer到partition怎么个可靠法?

如果partition存储消息成功,在向producer放送ack时网络错误怎么办?

在partition内部如何可靠?

从partition交付到consumer如何可靠?

那么消息的重复消费怎么解决呢?

上一篇 下一篇

猜你喜欢

热点阅读