flink-streaming 相关问题

Apache Flink是一个用于可扩展批处理和流数据处理的开源平台。 Flink在一个系统中支持批量和流分析。分析程序可以用Java和Scala中简洁优雅的API编写。

ClassNotFoundException: org.apache.flink.client.CliFrontend 使用 flink 运行 jar 文件时

我已经在 Microsoft Windows 上下载了 Apache Flink 并运行了 start-local.sh。它有效,我可以通过导航到 http://localhost:8081/ 成功访问 Web 界面。 但当我尝试...

回答 1 投票 0

Flink 广播状态模式:避免不一致

在 Flink 文档中,我们被警告:“广播状态中的事件顺序可能因任务而异”。 如何实现跨任务具有一致广播状态的应用程序,

回答 1 投票 0

如何使用带有检查点的 Flink 来使用 S3 存储桶中的文件以进行故障恢复

我有一个用例来使用给定 S3 存储桶中存在的文件。 问题是我想确保 Flink 作业仅处理文件的每一行一次,以防作业重新启动。 如果是的话...

回答 1 投票 0

应用程序停止时如何从数据库流中的最后一个快照ID启动Flink应用程序

我正在 Java 中创建一个从 Iceberg 流式传输的 AWS Flink 应用程序,想知道 Flink 是否具有提供从成功的最后一个快照 ID 重新启动流的可能性的机制

回答 1 投票 0

Flink 作业提交到多虚拟机 Flink 集群失败,并出现 JobSubmissionException、CompletionException 和 Connection Refused 错误

我可以在笔记本电脑上使用 1 个作业管理器和 3 个任务管理器启动 Flink 集群(版本 1.17.x)。集群启动,作业可以在本地主机(我的笔记本电脑)上正确提交。 下一步是...

回答 1 投票 0

使用 GCP PubSub 源时在 Flink 作业上获取 DEADLINE_EXCEEDED

在我正在使用的 Flink 作业中使用 Pub/Sub 源时,以下错误每 15 秒就会重复一次。 https://nightlies.apache.org/flink/flink-docs-master/docs/connectors/datastream/pubsub/ 苏...

回答 1 投票 0

在 Flink 应用程序中从 AWS S3 存储桶读取 ORC 文件

我们正在使用 Flink 版本 1.13.5 并尝试从 AWS S3 位置读取 ORC 文件。而且,我们正在将应用程序部署在自我管理的 Flink 集群中。请查找以下代码以了解更多信息...

回答 1 投票 0

Flink 广播状态模式:故障恢复

根据文档“No RocksDB state backend”到广播状态。 这是否意味着每次失败(任务级别或整个 JVM)时,新重新启动的任务都会...

回答 1 投票 0

为什么 Flink 在每次调用测试工具中的 processElement 后都会重置我的状态?

我正在使用 Flink 的 KeyedOneInputStreamOperatorTestHarness 并调用 processElement 两次。 processElement 将更新状态以计算所看到的元素数量。 在这种情况下,拨打电话后

回答 1 投票 0

将相同的方法引用传递给 apache flink 中的过滤器会抛出 classcastException

以下代码抛出 ClasscastException (java.lang.ClassCastException: class java.lang.Integer无法转换为 class java.lang.String ) 最终数据流源 st1 =

回答 1 投票 0

Flink 与 Kafka Source 和 Iceberg Sink 不写

使用Flink我尝试从Kafka读取数据,将Protobuf事件转换为Json字符串并将其写入Iceberg中的表中。 我按照官方文档编写了代码,但我必须有

回答 2 投票 0

Flink Stream 处理处理部分失败并避免重新处理

我有 Flink 流处理应用程序,它从 Pulsar Topic 读取消息流,处理它们并将文件存储在 S3 中。它执行以下操作。 每隔一段时间阅读 Pulsar 主题的消息...

回答 1 投票 0

Flink SQL Streaming - 如何在记录更改不确定的情况下有效地连接表

卡卡主题(输入:table1,table2,输出:table3) Flink SQL 流作业 创建临时视图distinct_table1 AS 选择 * 从(选择*, ROW_NUMBER() OVER(按 id 分区,按change_date d 排序...

回答 1 投票 0

了解水印

我只是想表达我对 BoundedOutOfOrder Watermarks 在 FLINK 以及任何流处理框架中如何工作的理解。 事件处理顺序: 11:00 11:01 11:0...

回答 1 投票 0

在PyFlink中使用SourceFunction和SinkFunction

我是 PyFlink 的新手。我已经用Java完成了官方培训练习:https://github.com/apache/flink-training 然而,我正在进行的项目必须使用Python作为编程语言。我...

回答 2 投票 0

MetricQueryService - 某些指标将不会被报告

升级Flink v.1.16.1(从v.1.13.2)后,我看到以下日志: 2023-03-06 INFO org.apache.flink.runtime.metrics.dump.MetricQueryService [] - 某些指标将不会被报告...

回答 1 投票 0

Jobmanager重启后Flink无法从checkpoint恢复

我正在 Docker-compose 上运行 flink 集群,其中包含 1 个 jobmanager 和 1 个 taskmanager。我通过重启Jobmanager的容器来测试checkpoint的机制。但我发现状态没有恢复

回答 1 投票 0

Flink 流媒体管道未向 Kafka 提交偏移量

我们有多个Flink流应用程序。这些应用程序每 30 秒左右向 Kafka 提交一次偏移量。我们看到 Flink 根本没有向 Kafka 提交偏移量。这会导致不匹配...

回答 1 投票 0

Flink 中的容错

我们如何配置 Flink 应用程序以仅启动/重新启动崩溃的 Pod/(子)任务,而不是重新启动整个作业,即重新启动作业/管道中的所有任务/子任务,包括...

回答 2 投票 0

Apache Flink dataStream.sinkTo() 不接受 KafkaSink<String> 作为参数。正在等待Sink<String, ?, ?, ?>

我是 Apache Flink 的新手。我正在尝试从 Kafka 流式传输数据,在 Flink 上执行某些操作并将数据发布到 Kafka 中的其他某个主题。 下面是添加的依赖项 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.