Kafka入门操作实例

2019-06-24 本文已影响0人 air_b10f

一、是什么

Kafka是由Apache软件基金会开发的一个开源流处理平台，由Scala和Java编写。Kafka是一种高吞吐量的分布式发布订阅消息系统，它可以处理消费者在网站中的所有动作流数据。这种动作（网页浏览，搜索和其他用户的行动）是在现代网络上的许多社会功能的一个关键因素。这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。对于像Hadoop一样的日志数据和离线分析系统，但又要求实时处理的限制，这是一个可行的解决方案。Kafka的目的是通过Hadoop的并行加载机制来统一线上和离线的消息处理，也是为了通过集群来提供实时的消息。

一个MQ需要哪些部分？生产、消费、消息类别、存储等等。

对于kafka而言，kafka服务就像是一个大的水池。不断的生产、存储、消费着各种类别的消息。那么kafka由何组成呢？

1、 Kafka服务

> Topic：主题，Kafka处理的消息的不同分类。

> Broker ：消息代理，Kafka集群中的一个kafka服务节点称为一个broker ，主要存储消息数据。存在硬盘中。每个topic 都是有分区的。

> Partition：Topic物理上的分组，一个topic 在broker 中被分为1个或者多个partition，分区在创建topic 的时候指定。

> Message：消息，是通信的基本单位，每个消息都属于一个partition

2、 Kafka服务相关

> Producer ：消息和数据的生产者，向Kafka的一个topic 发布消息。

> Consumer：消息和数据的消费者，定于topic 并处理其发布的消息。

> Zookeeper：协调kafka的正常运行。

二、特点