我有一个流应用程序,可以计算传入交易的高/低/交易量。我有一个包含交易信息的输入主题。没有与这些消息关联的时间戳。我从输入流中创建一个KGroupedStream,并按股票代码将其分组为键
然后我从KGroupedStream创建一个KTable。我汇总数据并计算高/低/体积,并创建一个名为HiLowMessage的新消息,并将其流式传输到我的输出流中。
由于输入主题始终具有数据。如何确保仅对TODAY的数据进行汇总,而不包括昨天的数据?请注意,输入主题消息结构中没有时间戳。
每个Kafka消息的元数据字段中确实有一个时间戳(即,除了键和值之外)。此时间戳通常由将数据写入主题的上游生产者设置。默认情况下,该记录元数据时间戳记在Kafka Streams中使用。因此,您可以使用1天跳频TimeWindow
进行窗口聚合。