apache-flink 相关问题

Apache Flink是一个用于可扩展批处理和流数据处理的开源平台。 Flink在一个系统中支持批量和流分析。分析程序可以用Java和Scala中简洁优雅的API编写。

Apache Flink 中窗口函数结果元素的时间戳

Flink 文档说“在结果元素上设置的唯一相关信息是元素时间戳 [...],它[设置为]结束时间戳 - 1 [...]” 万一我必须

回答 1 投票 0

具有窗口 CoGroup 和未对齐检查点的 Flink 状态处理器 API

如何使用 Flink State Processor API 处理窗口 CoGroup(或 Join)函数的状态?文档没有给出这样的例子。 有没有办法使用 Flink State Pro...

回答 1 投票 0

如何将凭证从kafka和数据库传递到FlinkSessionJob

我在k8s中部署了一个flink操作器版本1.10,flink本身(FlinkDeployment)被部署为集群会话,我想部署几个不同的FlinkSessionJobs,并且对于每个我需要定义...

回答 1 投票 0

PyFlink 转换字节

我正在尝试在 PyFlink 中创建字节类型的数据流。以下代码会产生错误: #!/bin/python # -*- 编码:utf-8 -*- 来自 pyflink.common 导入类型 来自 pyflink.datastream 我...

回答 1 投票 0

如何设置处理时间的CUMULATE窗口参数?

我的Flink版本是1.15.0 这是源表ddl: 创建临时表 source_table ( // ...不重要的列 // ... proctime AS PROCTIME() -- 在处理时间运行 ); ...

回答 1 投票 0

Flink Kafka SQL 设置'auto.offset.reset'

在使用组偏移作为扫描启动模式时,我无法将 auto.offset.reset 设置为最新。我已经尝试使用属性。* 如文档中所述 - https://nightlies.apache.org/flink/flink-docs-

回答 2 投票 0

包含元组列表的 POJO 的 Apache Flink 类型信息错误

[已编辑:这次添加了正确的错误日志] 我无法创建包含元组列表数据类型的 POJO 类型类。也许我没有正确提供它的类型信息?

回答 1 投票 0

GroupBy 窗口聚合:处理空窗口

从流媒体源消费时, 我们使用 Groupby 窗口聚合: .group_by(col('name'))) (参见此处) 并有一个包含所有可能的名称值的表(在下面的示例中 ['Alice', 'Bob...

回答 1 投票 0

Pytorch Djl java加载异常

我正在独立部署模式下运行 Flink 作业,该作业使用 Java djl 加载 pytorch 模型。模型已成功加载,我可以通过 Flink Rest API 取消该作业。然而...

回答 2 投票 0

FlinkSQL 将没有时区的 TIMESTAMP(3) 列转换为 BIGINT

我必须将时间戳列转换为bigint以映射flinksql中的目标列,并且不想为其编写自定义UDF。 有什么建议吗?? 列定义为 max_updated 作为 TIMESTAMP(3) -- 否 ...

回答 2 投票 0

通过 Flink 在高负载下按组 ID 近乎实时地聚合各个事件

如果这是微不足道的,请原谅我,但是我在文档之外没有太多使用 Flink 的经验。 假设有一个购买流。每次购买间隔 1 秒(或任意 amo...

回答 1 投票 0

FlinkSQL 将时间戳转换为bigint

我必须将时间戳列转换为bigint以映射flinksql中的目标列,并且不想为其编写自定义UDF。 有什么建议吗?? “最大更新”:{ “长”:“...

回答 1 投票 0

如何使用Flink的table API处理延迟事件?

看起来 Flink 的 Table API 目前删除了延迟事件。我见过一些利用 DataStreaming API 的示例,但我的整个 Flink 应用程序都使用 Table API,所以我试图找到一个...

回答 1 投票 0

如何在不丢失数据的情况下部署 Kinesis Data Analytics

我们有一个复杂的 IoT 系统,其中 AWS Kinesis Flink 应用程序收集数据、处理数据并将新数据包转发到另一个系统。我们收集了很多小数据,比如来自

回答 1 投票 0

使用基于地理空间邻近度的滚动窗口聚合来连接时态表

我正在尝试将站状态数据与 Flink SQL 中的天气更新结合起来。目标是: 计算 1 分钟窗口内每个站的平均状态指标 加入基于

回答 1 投票 0

Flink Scala 无法序列化模拟对象

我正在努力在 scala flink 应用程序上编写单元测试。 例如,我有一个如下所示的异步映射器。它需要一个带有 id 的 User 对象,并随着年龄的增长而丰富: 案例类用户(id:字符串)...

回答 1 投票 0

如何修复 MobaXterm 上不正确指定的虚拟机选项“maxmetaspacesize”

我正在尝试使用 mobaXTerm 启动本地集群。我正在使用: 弗林克 1.15.3 MobaXterm 23.6 jdk 11或jdk 8(是相同的错误) Windows 10 我正确注册了所有环境变量,但是...

回答 1 投票 0

Processing Time Temporal Join 是否支持 FOR SYSTEM_TIME AS OF 语法

我正在阅读 Flink 1.20 文档 https://nightlies.apache.org/flink/flink-docs-release-1.20/docs/dev/table/sql/queries/joins/#processing-time-temporal-join 据说不支持加工

回答 1 投票 0

Flink 时间连接不一致

我有3个Kafka主题:optionsTopic、stocksTopic和referencesTopic。所有内容均以 Kraft 模式本地部署在单个 Kafka (v7.7.1) 实例上。为了降低复杂性,我设置了一个分区...

回答 1 投票 0

使用 kafka 连接器运行 flink 时出现 NoClassDefFoundError

我正在尝试使用flink从kafka流式传输数据。我的代码编译没有错误,但在运行时出现以下错误: 错误:发生 JNI 错误,请检查您的安装并尝试

回答 6 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.