如何获取kafka中未提交的消息

问题描述 投票:0回答:1

我在java中有一个函数,我试图在其中获取未读的消息。例如,如果我在代理中有offSet 0,1,2 的消息已被消费者读取,并且如果我关闭消费者一个小时。那时我生成偏移量为 3,4,5 的消息。之后,当我的消费者启动时,它应该从偏移量 3 而不是从 0 读取消息。但是,它要么读取所有消息,要么读取启动 Kafka 消费者后生成的消息。我想阅读那些未读或未提交的消息

我尝试了

"auto.offset.reset"= "latest"
"earliest"
。以及
"enable.auto.commit" = "true"
"false"
。在调用
commitSync()
方法之前我也尝试过
commitAsync()
close()
但没有运气。

public static KafkaConsumer createConsumer() {

    Properties properties = new Properties();
    properties.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, Constants.KAFKA_BROKER);
    properties.put(ConsumerConfig.GROUP_ID_CONFIG, "testGroup");
    properties.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());
    properties.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, StringDeserializer.class.getName());
    properties.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "latest"); 
    properties.put(ConsumerConfig.MAX_POLL_RECORDS_CONFIG, "50");
    properties.put(ConsumerConfig.AUTO_COMMIT_INTERVAL_MS_CONFIG, "1");
    properties.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, false);

    KafkaConsumer<String, String> consumer = new KafkaConsumer<String, String>(properties);

    consumer.subscribe(Collections.singleton(Constants.TOPIC));
    return consumer;

}

public static void main(String[] args) {

    System.out.println("");
    System.out.println("----------------");
    System.out.println("");
    System.out.println("KAFKA CONSUMER EXAMPLE");
    System.out.println("");
    System.out.println("----------------");
    System.out.println("");

    OffsetAndMetadata offsetAndMetadataInitial = createConsumer().committed(new TopicPartition(Constants.TOPIC, 0));

    System.out.println("");
    System.out.println("Offset And MetaData Initial : ");
    System.out.println(offsetAndMetadataInitial);
    System.out.println("");

    ConsumerRecords<String, String> consumerRecords = createConsumer().poll(Duration.ofSeconds(2L));

    System.out.println("");
    System.out.println("Count Consumer Records : " + consumerRecords.count());
    System.out.println("");

    Iterator<ConsumerRecord<String, String>> itr = consumerRecords.iterator();
    Map<TopicPartition, OffsetAndMetadata> partationOffsetMap = new HashMap<>(4);

    while (itr.hasNext()) {

        ConsumerRecord record = itr.next();

        System.out.println("OffSet : " + record.offset());
        System.out.println("");
        System.out.println("Key : " + record.key());
        System.out.println("Value : " + record.value());
        System.out.println("Partition : " + record.partition());
        System.out.println("--------------------------");
        System.out.println("");

    }



    createConsumer().close();

}

我只想获取kafka Consumer中未读的消息。如果我有错的地方请纠正我。提前致谢

java apache-kafka kafka-consumer-api
1个回答
3
投票

代码中的主要问题是您没有关闭用于轮询消息的消费者;这是因为每次调用

createConsumer()
都会创建一个新的 KafkaConsumer。由于您没有关闭消费者,并且仅调用
poll()
一次,因此您永远不会提交已阅读的消息。

(使用自动提交,在自动提交间隔后的

poll()
内以及
close()
内调用提交)

一旦您更正它应该可以使用以下设置:

  • auto-commit=true(否则你也可以手动提交,但自动提交更简单)。
  • offset-reset=最早(这仅在您第一次消费给定组id时有效,以判断您是否要从主题的开头消费或仅在开始消费后生成的消息。一旦开始消费要使用给定的组 ID 进行消费,您将始终从您提交的最新偏移量继续消费。)
  • 组 ID 在重新启动之间不得更改,否则您将根据您的偏移重置设置再次从头开始或从末尾开始。
最新问题
© www.soinside.com 2019 - 2024. All rights reserved.