apache-flink 相关问题

Apache Flink是一个用于可扩展批处理和流数据处理的开源平台。 Flink在一个系统中支持批量和流分析。分析程序可以用Java和Scala中简洁优雅的API编写。

PyFlink 数据流 API 对窗口的支持

Apache Flink 的 Python SDK (PyFlink) Datastream API 是否支持 Windowing 等运算符?到目前为止,无论我见过多少使用 PyFlink 进行窗口化的示例,它们都使用了 Table API。数据流 API ...

回答 2 投票 0

FlinkSQL:访问kafka密钥

假设我想为我的 Flink SQL 使用 kafka 源...它由 aiven 管理。 我怎样才能访问消息的密钥? 问题: 我正在生成有关源主题的消息,但有点...

回答 1 投票 0

如何处理 Apache Flink / AWS Kinesis 连接器中的无效 JSON?

我有一个简单的 Apache Flink (PyFlink) 应用程序,它使用官方 flink 连接器和 Flink TableAPI https://nightlies.apache.org/flink/flink-docs-

回答 1 投票 0

Flink 任务管理器不卸载类

我有独立的 Flink 集群。当我在任务管理器上停止该进程时,作为 ChildFirst 加载的类不会被删除。经过多次启动/停止重复后,元空间超出了最大...

回答 1 投票 0

Flink 1.15 中的 cleanupInRocksdbCompactFilter 方法

我无法理解 Apache Flink 1.15 中有关 TTL 设置的“cleanupInRocksdbCompactFilter”方法的“queryTimeAfterNumEntries”参数。 医生说: Rocksdb 时清理过期状态

回答 1 投票 0

我认为并行度 16 应该在所有子任务之间严格分配

我有一个 flink 应用程序,我使用 TumblingEventTimeWindows 和 process 函数 数据流>processedEvents = rawEvents .keyBy(eventMap -> { 返回

回答 1 投票 0

Apache Flink AsyncRetryStrategy 与 RichAsyncFunction

AsyncRetryStrategy asyncRetryStrategy = new AsyncRetryStrategies.FixedDelayRetryStrategyBuilder(3, 100L) // maxAttempts=3,fixedDelay=100ms .ifResult(RetryPredicates.EMPTY_RESULT_PREDIC...

回答 1 投票 0

将 Flink DataStream<POJOs> 转换为 DataStream<RowData> 以供 Apache Iceberg 使用的最佳方法

我是 Flink 的新手,尝试使用 Flink 与 Kafka 作为数据输入,并使用 Iceberg 来存储数据。 这是我已完成的步骤。 从 kafkaSource 读取 java POJO 的数据流(使用 Avro s...

回答 1 投票 0

为什么ListView的性能比ArrayList好

我在使用Flink(版本1.20)自定义UDAF时遇到了问题。我想实现一个计算中位数的UDAF,我使用了以下两种方法: 公共类 MedianUDAF2 扩展...

回答 1 投票 0

Confluence Flink 窗口查询中的 Flink SQL 提示

如何在 Confluence Flink 上的窗口查询中使用提示? 提示示例: /*+ OPTIONS('scan.startup.mode'='latest-offset') */ 我想在如下查询中使用它: 插入主题2(...

回答 1 投票 0

Java Flink NoClassDefFoundError org/apache/flink/shaded/guava30/com/google/common/io/Closer

我有一个 Java 21 应用程序,它使用 Apache Flink(版本 1.20.0)依赖项来过滤 kafka 流。 当我尝试执行我的程序时,出现以下错误: [flink-pekko.actor.default-

回答 1 投票 0

flink 中作业、任务和子任务的区别

我是flink新手并尝试理解: 工作 任务 子任务 我在文档中搜索但仍然没有得到它。他们之间的主要区别是什么?

回答 1 投票 0

Flink 无法反序列化 Debezium 生成的 JSON

我正在尝试使用 Flink 来消费 Debezium 生成的更改事件日志。 JSON 是这样的: { “架构”:{ }, “有效负载”:{ “之前”:空, &

回答 2 投票 0

java.lang.ClassCastException:类[B无法转换为类org.apache.flink.types.Row

我使用apache pyflink 1.18.1。来自 Apache Flink kafka 源的输入数据类型如下所示, 2023-11-01, 2.7, 怀俄明州, WYURN, 怀俄明州失业率, M, %, NSA 2023-12-01, 2.6, 怀俄明州, WYU...

回答 1 投票 0

原因:org.apache.avro.AvroRuntimeException:数据格式错误。长度为负数:-53

尝试使用 Flink 读取“avro”序列化数据的 Kafka 流,如下所示: tableEnv.connect(新的卡夫卡() .版本(“0.11”) .topic(源.getTopic()) ...

回答 1 投票 0

Apache Beam Pipeline KafkaIO - 手动提交偏移量

我有一个 Beam 管道来使用多个阶段(PTransforms)的流事件来处理它们。看下面的代码, pipeline.apply("从流中读取数据", StreamReader.rea...

回答 2 投票 0

Apache Flink - java.lang.NoClassDefFoundError:org/apache/flink/api/connector/sink2/Sink

我编写了一个 Flink 管道,将数据流以 parquet 格式写入文件。我使用 sinkTo 方法将输出写入文件。应用程序启动时出现以下异常。 java.lang.

回答 2 投票 0

如何横向扩展 flink 进程以使用更多进程?

我有一个批处理作业,涉及一组映射和归约步骤,我已成功将其转换为 Apache Flink 应用程序。 作为概念证明,我使用 3

回答 1 投票 0

Flink 中如何让两个接收器在一个事务中工作

我有一个 Flink 管道,它有两个接收器,一个接收器用于将消息发布到 Kafka,另一个接收器用于更新数据库中的状态。我使用 Kafka 事务和 XA 遵循一次语义...

回答 1 投票 0

新的 hiveCof() 初始化错误“java.lang.ClassNotFoundException:org.apache.hadoop.mapred.JobConf”

我在使用Flink写带有hive目录的Paimon表时遇到了异常。 java.lang.ClassNotFoundException:org.apache.hadoop.mapred.JobConf 在 java.net.URLClassLoader.findClass(

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.