java操作kafka

2017-01-13  本文已影响701人  先生_吕

【准备】
1 : zookeeper集群 搭建在224, 225, 226
2 : kafka使用3个节点224, 225, 226

修改配置文件config/server.properties
broker.id=224
host.name=192.168.1.224
log.dirs=/usr/local/kafka_2.10-0.8.2.0/kafka_log
复制到其他两个节点,然后修改对应节点上的config/server.pro

3 : 分别启动三个节点

[root@hadoop2004 bin]# ./kafka-server-start.sh -daemon ../config/server.properties

4 : 创建一个“test”主题

[root@hadoop2004 bin]# ./kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 3 --partitions 3 --topic test

5 : 查看详细信息

[root@hadoop2004 bin]# ./kafka-topics.sh --describe --zookeeper localhost:2181 --topic test 
2017-01-13_145426.png

6 : 去zookeeper上查看kafka集群

[zk: localhost:2181(CONNECTED) 0] ls /
[hbase, hadoop-ha, admin, zookeeper, consumers, config, controller, brokers, controller_epoch]
[zk: localhost:2181(CONNECTED) 1] ls /brokers
[topics, ids]
[zk: localhost:2181(CONNECTED) 2] ls /brokers/ids
[224, 225, 226]
[zk: localhost:2181(CONNECTED) 3] ls /brokers/topics
[test, lvfang]
[zk: localhost:2181(CONNECTED) 4] ls /brokers/topics/test
[partitions]
[zk: localhost:2181(CONNECTED) 5] ls /brokers/topics/test/partitions
[2, 1, 0]
[zk: localhost:2181(CONNECTED) 6] 
2017-01-13_145710.png

【编写java代码】
创建java工程,导入jar包(jar来自tar的lib下)

2017-01-13_145959.png

【1 :生产者类】KafkaProduce

import java.util.Properties;  
import java.util.concurrent.TimeUnit;  
  
import kafka.javaapi.producer.Producer;  
import kafka.producer.KeyedMessage;  
import kafka.producer.ProducerConfig;  
import kafka.serializer.StringEncoder; 

/**
 * kafka生产者类
 * @author lvfang
 *
 */
public class KafkaProduce extends Thread {

    private String topic;//主题
    
    public KafkaProduce(String topic){  
        super();  
        this.topic = topic;  
    } 
    
    //创建生产者
    private Producer createProducer(){
        Properties properties = new Properties();
        //声明zookeeper集群
        properties.put("zookeeper.connect",
                "192.168.1.224:2181," +
                "192.168.1.225:2181," +
                "192.168.1.226:2181");
        properties.put("serializer.class", StringEncoder.class.getName());  
        // 声明kafka集群的 broker
        properties.put("metadata.broker.list", 
                "192.168.1.224:19092," +
                "192.168.1.225:19092," +
                "192.168.1.226:19092");
        return new Producer<Integer, String>(new ProducerConfig(properties)); 
    }
    
    @Override
    public void run() {
        //创建生产者
        Producer producer = createProducer();  
        int i=0;  
        //循环发送消息到kafka
        while(true){  
            producer.send(new KeyedMessage<Integer, String>(topic, "message: " + i++));  
            try {  
                //发送消息的时间间隔
                TimeUnit.SECONDS.sleep(3);  
            } catch (InterruptedException e) {  
                e.printStackTrace();  
            }  
        }  
    }
    
    public static void main(String[] args) {
        // 使用kafka集群中创建好的主题 test  
         new KafkaProduce("test").start(); 
    }
}

【2 : kafka集群中消费主题test的数据】

bin/kafka-console-consumer.sh --zookeeper localhost:2181 --topic test --from-beginnin  

【3 : 开启生产者的java线程】
这时你会发现接收者已经可以接受到消息了

2017-01-13_150648.png

【4 : 消费者类】KafkaCusumer

import java.util.HashMap;  
import java.util.List;  
import java.util.Map;  
import java.util.Properties;  
  
import kafka.consumer.Consumer;  
import kafka.consumer.ConsumerConfig;  
import kafka.consumer.ConsumerIterator;  
import kafka.consumer.KafkaStream;  
import kafka.javaapi.consumer.ConsumerConnector;
/**
 * kafka消费者类
 * @author lvfang
 *
 */
public class KafkaCusumer extends Thread {

    private String topic;//主题
    
    public KafkaCusumer(String topic){  
        super();  
        this.topic = topic;  
    } 
    
    //创建消费者
    private ConsumerConnector createConsumer(){
        Properties properties = new Properties();
        //声明zookeeper集群链接地址
        properties.put("zookeeper.connect",
                        "192.168.1.224:2181," +
                        "192.168.1.225:2181," +
                        "192.168.1.226:2181");
        //必须要使用别的组名称, 如果生产者和消费者都在同一组,则不能访问同一组内的topic数据  
        //当前消费者的组名称
        properties.put("group.id", "group1");
        return Consumer.createJavaConsumerConnector(new ConsumerConfig(properties));
    }
    
    @Override
    public void run() {
        //创建消费者
        ConsumerConnector consumer = createConsumer();  
        //主题数map
        Map<String, Integer> topicCountMap = new HashMap<>();
        // 一次从topic主题中获取一个数据 
        topicCountMap.put(topic, 1);
        //创建一个获取消息的消息流
        Map<String,List<KafkaStream<byte[], byte[]>>> messageStreams = consumer.createMessageStreams(topicCountMap);
        // 获取每次接收topic主题到的这个数据  
        KafkaStream<byte[], byte[]> stream = messageStreams.get(topic).get(0);
        ConsumerIterator<byte[], byte[]> iterator = stream.iterator();
        //循环打印
        while (iterator.hasNext()) {
            String message = new String(iterator.next().message());
            System.out.println("接收到: " + message);          
        }
    }
    
    public static void main(String[] args) {
        // 使用kafka集群中创建好的主题 test 
        new KafkaCusumer("test").start();  
    }
}

开启消费者线程你会发现消费者也可以接收到并消费

2017-01-13_150705.png

【流程】

生产者生产数据   ---->   推送  ---->   kafka   ---->  获取   ---->   消费者获取数据

【补充说明】

补充说明:
1、public Map<String, List<KafkaStream<byte[], byte[]>>> createMessageStreams(Map<String, Integer> topicCountMap),其中该方法的参数Map的key为topic名称,value为topic对应的分区数,譬如说如果在kafka中不存在相应的topic时,则会创建一个topic,分区数为value,如果存在的话,该处的value则不起什么作用

2、关于生产者向指定的分区发送数据,通过设置partitioner.class的属性来指定向那个分区发送数据,如果自己指定必须编写相应的程序,默认是kafka.producer.DefaultPartitioner,分区程序是基于散列的键。

3、在多个消费者读取同一个topic的数据,为了保证每个消费者读取数据的唯一性,必须将这些消费者group_id定义为同一个值,这样就构建了一个类似队列的数据结构,如果定义不同,则类似一种广播结构的。

4、在consumerapi中,参数设计到数字部分,类似Map<String,Integer>,
numStream,指的都是在topic不存在的时,会创建一个topic,并且分区个数为Integer,numStream,注意如果数字大于broker的配置中num.partitions属性,会以num.partitions为依据创建分区个数的。

5、producerapi,调用send时,如果不存在topic,也会创建topic,在该方法中没有提供分区个数的参数,在这里分区个数是由服务端broker的配置中num.partitions属性决定的

上一篇下一篇

猜你喜欢

热点阅读