apache-kafka-streams 相关问题

与Apache Kafka的内置流处理引擎相关，称为Kafka Streams，它是一个用于使用Apache Kafka构建分布式流处理应用程序的Java库。

如何访问 Kafka Streams 中 GlobalKTable 中的标头

我正在尝试在应用程序启动期间使用 GlobalKTable 存储来自 Kafka 主题的数据。 GlobalKTable 和 KStream 都使用相同的主题，我需要访问

java spring-boot apache-kafka spring-kafka apache-kafka-streams

回答 1 投票 0

当多条消息输出时，Kafka Streams 使用 Transformer 发送自定义标头

我想使用 Transformer (kafka Streams dsl) 向下游发送多条消息私有 ProcessorContext 上下文； @覆盖公共无效初始化（ProcessorContext上下文）{ 这个。

java apache-kafka apache-kafka-streams

回答 1 投票 0

Kafka Streams：ProcessorRecordContext 中的 NPE 和使用 processValues() 抑制问题

我在 Kafka Streams 的 processValues() 和抑制操作方面遇到两个问题：使用 processValues() 时获取 NPE： @豆公共函数，KStream<

apache-kafka-streams suppress

回答 1 投票 0

Kafka Streams 窗口大小（15 分钟）大于最大轮询间隔（5 分钟）

我有一个 Kstreams 应用程序，我正在从输入主题中读取内容，在 15 分钟的窗口中执行聚合，抑制然后对每个记录执行一些操作，以下是...

apache-kafka spring-kafka apache-kafka-streams

回答 1 投票 0

查看在流应用程序的输出中创建的重复记录

我有一个 Kafka Streams 应用程序，它从 Kafka 主题获取输入，在 5 分钟窗口内将其聚合到原始值的三个字段上。在输出方面，我需要翻译 aggre...

apache-kafka apache-kafka-streams apache-kafka-connect apache-iceberg

回答 1 投票 0

Kafka Streams 从 JSONObject 创建空模式

我正在编写一个 Kafka Streams 应用程序，该应用程序将从非关系自定义 Kafka 源连接器接收的数据进行转换，并将其拆分为多个主题以对其进行规范化（以便可以使用...

apache-kafka apache-kafka-streams apache-kafka-connect confluent-schema-registry

回答 1 投票 0

Kafka Streams 状态存储与 MongoDB 的状态管理

我正在开发一个使用 Kafka Streams 进行组件之间通信的分布式系统。其中一个组件（为了简单起见，BRAIN）管理发送给其他组件的一系列消息（A，...

mongodb apache-kafka architecture apache-kafka-streams

回答 1 投票 0

如何避免使用KafaConsumer API消费kafka消息的延迟

我需要从 Kafka 主题快速检索 1000 条消息，但初始检索很慢 kafka-clients 3.6.1 KafkaConsumer API。我们正在从旧的 Kafka 客户端（版本 0.8.1）迁移到...

java performance apache-kafka apache-kafka-streams

回答 1 投票 0

应用程序仅针对 1 个输入生成 2 条消息

我正在尝试调试我们的生产 Kafka Streams 应用程序中的问题。（简化的）拓扑看起来像这样 builder.stream("输入").groupByKey().reduce( (agg, val) -> &quo...

apache-kafka apache-kafka-streams reduce

回答 1 投票 0

Kafka 流提交偏移语义

我只是想确认一些我认为在文档行之间的内容。说 kafka 流中的提交独立于偏移量/消息是否已正确，是否正确？

apache-kafka-streams

回答 2 投票 0

Kafka 流外键与一对多关系连接

有两个kafka主题消息图片新闻主题中的消息可以包含图像 ID 列表，如下所示 { “id”：“新闻-1”， "title": "标题新闻-1", ...

apache-kafka java-stream apache-kafka-streams confluent-platform confluent-cloud

回答 1 投票 0

Kafka Stream 抑制会话窗口聚合

我在 Kafka 流应用程序中编写了以下代码： KGroupedStream groupedStream = Stream.groupByKey(); groupedStream.windowedBy( SessionWindows.with(Duration.ofSeconds(3))....

apache-kafka apache-kafka-streams window-functions suppress

回答 3 投票 0

具有基于线程并行性的 Kafka Streams 与用于并行处理的 Kafka Parallel Consumers

我们正在为实时协作形式构建事件驱动的架构。我们的解决方案使用 Kafka 作为事件代理，其中事件排序和有状态流处理是关键要求。 ...

apache-kafka kafka-consumer-api apache-kafka-streams

回答 1 投票 0

从自定义偏移量恢复 Kafka Stream

我正在尝试找到某种方法来从手动偏移恢复 Kafka Streams。通过在互联网上查找，我没有找到任何说可以的答案。有什么办法吗？或者必须回到低水平

apache-kafka kafka-consumer-api apache-kafka-streams

回答 1 投票 0

Kafka Streams - 为什么我不能聚合和总结我的多头？

我是 Kafka Streams 的新手，我正在尝试拼凑我的第一个应用程序。我想将我的银行交易金额加起来。 @豆公共 KStream kStream(StreamsBuilder

java spring spring-kafka apache-kafka-streams

回答 1 投票 0

如何在特定时间范围内聚合KStream到固定大小的列表？

考虑这个 KStream： KStream inputStream = StreamsBuilder.stream("kafka-topic", Consumed.with(Serdes.String(), Serdes.String())); 物化考虑这个 KStream： KStream<String, String> inputStream = streamsBuilder.stream("kafka-topic", Consumed.with(Serdes.String(), Serdes.String())); Materialized<String, List<String>, WindowStore<Bytes, byte[]>> with = Materialized.with(Serdes.String(), STRING_LIST_SERDE); KStream<Windowed<String>, List<String>> outputStream = inputStream .groupByKey() .windowedBy(TimeWindows.ofSizeWithNoGrace(Duration.ofSeconds(2))) .aggregate( ArrayList::new, (key, string, aggregate) -> { aggregate.add(string); return aggregate; }, with) .toStream(); outputStream 将聚合来自 inputStream info 的所有消息，定义时间范围内的消息数组。另外，现在我想将消息聚合到特定限制，例如直到列表大小不超过 50 条。如果列表在聚合过程中变得大于 50，我想以某种方式将其拆分为附加列表。基本上，我希望实现的输出是获取一组消息，其大小达到限制（例如 50 条），并且达到特定的时间范围，以先到者为准。为了实现这一目标，我在这里缺少什么？您可以尝试将 KTable 转换为 KStream 并执行 flatMapValues 来拆分列表，如下所示（Kotlin 中的代码）： val s = streamsBuilder.stream("kafka-topic", Consumed.with(Serdes.String(), Serdes.String())) val output = s .groupByKey() .windowedBy(TimeWindows.ofSizeWithNoGrace(Duration.ofSeconds(2))) .aggregate({ mutableListOf() }, { k: String, str: String, agg: List<String> -> agg.plus(str) }) .toStream() .flatMapValues { strList -> strList.chunked(50) } 但这意味着您将整个聚合列表加载到内存中 - 可能会也可能不会是一个问题，具体取决于列表大小和您的内存设置，但这绝对是需要记住的事情。

java spring spring-boot apache-kafka apache-kafka-streams

回答 1 投票 0

Kafka Streams 用于聚合事件处理和对大量任务的可扩展性

我有以下任务：假设我正在开发一个由一百万用户使用的在线商店。用户在不同的时间进行购买。每个用户的每次购买都会变成一次交易事件。我...

apache-kafka apache-kafka-streams

回答 1 投票 0

Kafka Streams 和 CompletableFuture（或异步 java api）

我正在研究 Apache Kafka Stream SPI。我想知道是否有一种方法可以在 mapValues 方法内部执行异步代码。例如从外部存储检索数据。有没有办法整合...

java apache-kafka reactive-programming apache-kafka-streams completable-future

回答 1 投票 0

如何提取 Kafka Streams 中消息中嵌入的时间戳

我想提取每条消息中嵌入的时间戳并将它们作为 json 有效负载发送到我的数据库中。我想获得以下三个时间戳。事件时间：事件发生的时间点...