airflow 相关问题

Airflow是一个工作流管理平台,可以编程方式创作,安排和监控工作流,作为任务的有向非循环图(DAG)。

在 k8s 中运行自己的 Airflow 的 OpenMetadata

我正在尝试使用官方 Helm Chart 在 k8s 中运行 OpenMetadata,但我想使用已经运行的 Airflow 实例。 我按照文档设置了 openmetadata 依赖项......

回答 2 投票 0

BashOperator 是否可以访问 PythonOperator 保存在目录中的文件?

我目前正在开发一个项目,我需要从一系列非常大的文本文件中 grep 一些行。文本文件与数千个其他文件一起位于 gcs 存储桶中。 他们需要合作...

回答 1 投票 0

XCOM 返回“无”

我的 Airflow 任务遇到以下问题。我是这个主题的新手,尽管我已经阅读过它,但我无法解决它。 其中一项任务从 Spotify 检索访问令牌。重新...

回答 1 投票 0

Airflow 动态映射任务不按顺序运行

您好,我有一个用例,我需要对数据集合运行一系列转换。 我将转换序列分组到一个任务组中,以便动态地将 tg 映射到...

回答 1 投票 0

气流:无法连接到('0.0.0.0',8080)

我使用的是Ubuntu 16.04,我已经使用pip安装了Airflow。下一步 气流初始化数据库 [2017-07-29 12:20:23,483] {__init__.py:57} 信息 - 使用执行器 SequentialExecutor DB:sqlite:////home/milenko/air...

回答 3 投票 0

如何利用airflow进行实时数据处理

我有一个场景,我想处理 csv 文件并加载到其他数据库: 案例 pic csv 文件并加载到与 csv 同名的 mysql 然后使用 py 对加载的行进行一些修改...

回答 2 投票 0

Airflow - 根据条件停止 DAG(跳过分支后的剩余任务)

我是气流方面的新手,所以我在这里有疑问。 如果满足第一个任务的条件,我想运行 DAG。如果条件不满足,我想在第一个任务之后停止该任务。 例子: # ...

回答 2 投票 0

airflow 动态任务映射不起作用

我有以下 DAG,它应该生成变量中指定的尽可能多的任务,但映射的任务选项卡显示“未找到数据”: 从日期时间导入日期时间 从时间导入睡眠

回答 1 投票 0

从失败的 Airflow KubernetesPodOperator 任务中提取 XCOM 值

我正在开发一个继承自 KubernetesPodOperator (KPO) 的操作符来执行 bash 脚本。 我有内置的错误处理来处理此 b 失败的许多可能原因...

回答 1 投票 0

[Airflow]:使用 Xcoms 在 DockerOperator 上进行动态任务映射

我正在创建一个 dag,它应该执行以下操作: 获取事件 ID 对于每个事件 ID,获取事件详细信息 ( DockerOperator ) 下面的代码是我尝试做我想做的事情: 进口再 从日期时间

回答 1 投票 0

[Airflow]:使用 Xcoms 在 docker 容器上应用动态任务映射

我正在创建一个 dag,它应该执行以下操作: 获取事件 ID 对于每个事件 ID,获取事件详细信息 这两个步骤使用 docker 容器,因为我不想使用 PythonOperator,因为我...

回答 1 投票 0

使用TaskFlow返回具有分支条件的task_id

关于以下任务。我有一个分支任务(choose_best_model),我想知道是否可以使用数据返回“is_accurate” @task.branch def select_best_model(准确度): ...

回答 1 投票 0

Airflow 如何从 on_failure_callback 自定义函数运行 bash 脚本

我想创建一个将在 on_failure_callback 上释放的函数。 它必须在安装 Airflow 的服务器上启动一个脚本。 有什么技巧可以做吗?

回答 1 投票 0

如何在 Airflow 中设置 SFTPSensor 以对服务器上出现的任何文件做出反应?

我对 Airflow 还很陌生。我正在尝试设置 SFTPSensor 以查看 SFTP 服务器上的文件夹中是否出现任何文件。对我来说,这听起来像是 file_pattern 中的正则表达式“*”

回答 2 投票 0

尝试从 Airflow DAG 失败中触发 AWS SNS 主题,以调用为失败的 DAG 创建 JIRA 票证的 Lambda 函数

我创建了一个测试 dag,该测试 dag 在运行测试时失败,但在 dag 失败后我无法触发 SNS 主题。 是否缺少或添加了某些内容使其无法工作并且

回答 1 投票 0

在Airflow中运行docker容器和python脚本

所以我有一个 Scrapy 项目,我可以将其容器化在 Docker 中,以及一个 Jupyter 笔记本(用于正常的数据预处理)。我想使用 Airflow 将它们自动化,但遇到了几个

回答 1 投票 0

Airflow Webserver Pod 无法从工作 Pod 获取日志

我已在 AKS 中部署了 Airflow [2.9.3]。但执行 DAGS 时出现以下错误。没有任何线索需要更新。我正在使用 Helm [1.15.0] 进行部署。我完全不知道...

回答 1 投票 0

Airflow 中未显示数据集选项卡

使用 Airflow 2.10.2,以管理员角色连接。 “数据集”选项卡不可见。 气流实例包含带有输出数据集任务的 dag。没有导入错误,数据集 c...

回答 1 投票 0

Airflow DAG 调度问题:为每月和每周运行传递正确的执行日期

我面临 Airflow 的问题,即我的 DAG 未将正确的执行日期传递给 DAG 中的查询。我有两个 DAG,其中一个计划在每月第一天运行,并且

回答 1 投票 0

尽管 Spark History UI 作业陷入运行状态,但作业在气流中失败。 AWS 无服务器

有没有人经历过 Airflow 中作业失败的情况,尽管在 Spark History UI 中,作业仍然停留在运行状态。另外,我添加了一行代码将数据写入S3(不读取我...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.