airflow 相关问题

Airflow是一个工作流管理平台,可以编程方式创作,安排和监控工作流,作为任务的有向非循环图(DAG)。

日志保存在本地和 AWS S3 上,但未加载到 Airflow UI 中。 (气流版本2.5.1)

我的 Apache Airflow 设置遇到问题,日志已成功保存在本地和 AWS S3 上。但是,当我尝试在 Airflow UI 中查看这些日志时,它们没有...

回答 1 投票 0

如何在不触发的情况下取消暂停Airflow DAG

我创建了一个 dag 工厂。 我将 dag 切换到取消暂停状态,它们立即开始工作,尽管设置了计划间隔值。尝试通过指定 is_active=False 来覆盖 DagModel。

回答 1 投票 0

如何知道是什么导致 Apache Airflow 中的简单 DAG 失败?

我是 Apache Airflow 的新手。 我想创建一个简单的 DAG,其中包含一个在虚拟环境中启动 python 脚本的任务: 从气流导入 DAG 从日期时间导入日期时间,时间增量

回答 2 投票 0

如何在 github 代码空间中设置气流环境?

我现在没有个人电脑,所以我一直在使用库电脑并使用 github 代码空间进行编码。 我在代码空间上安装了气流,但是当我尝试这样做时 气流独立 它创建管理员并通过...

回答 1 投票 0

KubernetesPodOperator xcom_push 键/值不可用于 xcom_pull 的后续任务

这是我正在尝试的 KubernetesPodOperator 的示例 -- set_tag = KubernetesPodOperator( 命名空间='默认', task_id='设置标签', name='设置标签', 图片='ub...

回答 2 投票 0

日期时间类型的对象在 Airflow DatabricksSqlOperator 中不可 JSON 序列化

我正在尝试使用 DatabricksSqlOperator 从 Databricks 增量表中获取 Airflow 中的一些数据: 选择 = DatabricksSqlOperator( databricks_conn_id = databricks_id, http_path=http...

回答 2 投票 0

气流 DAG 出现错误,>> 不支持操作数类型:“列表”和“列表”。任务的顺序和并行执行

我是 Apache Airflow 和 DAG 的新手。 DAG 中共有 6 个任务(task1、task2、task3、task4、task5、task6)。但在运行 DAG 时,我们收到以下错误。 不支持 DAG

回答 6 投票 0

Airflow Python 运算符类型错误:获得关键字参数“op_kwargs”的多个值

破碎的DAG:[] 回溯(最近一次调用最后一次): 文件“”,第 198 行,位于 some_task_op() >> 传输 >> Short_Circuit() >...

回答 1 投票 0

动态任务映射中的模板渲染

我正在尝试在 dataproc 上运行批处理,并且将 DAG 运行时间戳作为 Spark 属性 Spark.dataproc.driverEnv.REPORTING_TIMESTAMP 中的环境变量提交。 # 火花属性...

回答 1 投票 0

气流并行度

本地执行器在调度任务时生成新进程。它创建的进程数量是否有限制。我需要改变它。我需要知道时间表之间有什么区别...

回答 4 投票 0

YAML 在 Airflow/Shell 脚本中的 dbt 命令中作为变量传递

我在 YAML 验证方面遇到问题。字典值包含空格,这会导致问题。我在气流中的错误消息如下所示: 执行以下命令: dbt run --vars {"pos...

回答 1 投票 0

airflow DatabricksSubmitRunOperator 支持 python 轮吗

我知道我们可以通过 UI 提交 python 轮作业,但是是否可以使用气流 DatabricksSubmitRunOperator 来实现它? 对于doc,好像只支持python_file,有workar吗...

回答 1 投票 0

yaml 作为 Airflow 中 dbt 命令中的变量传递

我在 YAML 验证方面遇到问题。字典值包含空格,这会导致问题。我在气流中的错误消息如下所示: 执行以下命令: dbt run --vars {"pos...

回答 1 投票 0

在 Airflow 中使用 DataprocCreateClusterOperator 创建具有公共 IP 地址的 Dataproc 集群

我正在尝试使用 DataprocCreateClusterOperator 在 Airflow DAG 内的 GCP 项目中创建 Dataproc 集群。我正在使用 ClusterGenerator 生成集群的配置。怎么...

回答 1 投票 0

当 Airflow Neptune 任务的状态为“LOAD_IN_QUEUE”时 Airflow 尝试重试

我在多租户数据管道平台工作。所以,我们现在大约有 5 个租户。我们使用 AWS MWAA (Apache Airflow)作为编排工具。每个租户都有独立的DAG并按顺序串行运行...

回答 1 投票 0

Airflow 未在本地运行

我正在尝试使用 make airflow-up 在本地运行气流 我有一个配置文件,其密码位于 .aws 中 我收到这个错误 警告[0000] 未设置“AWS_ACCESS_KEY_ID”变量。

回答 1 投票 0

从 Amazon Redshift 到 Sharepoint 列表的数据提取

我目前正在公司开展一个项目,将数据从 Amazon Redshift 提取到 Sharepoint 列表。一些背景信息:此数据流最初是使用 Azure Data Factor 自动化的...

回答 1 投票 0

用户 [admin] 尝试访问 Airflow API 时身份验证失败

我们已经安装了 Elastic 和 Airflow 附带的 OpenMetadata 实例。我们使用官方 helm 图表及其图像“docker.getcollate.io/openmetadata/ingestion”。我升级到最新的了...

回答 1 投票 0

无法让 Airflow 使用 postgresql ( rds ) 代替 sqlite

我在3个ec2节点上安装了airflow:网络服务器、调度程序和worker,我在所有3个节点上将相同的配置设置为/airflow/airflow.cfg,数据库的配置是下一个sql_alchemy_conn = postgresql+psycopg2://a...

回答 1 投票 0

Redshift 使用 psycopg2 进行查询时出现意外结果 [INSERT INTO <table> SELECT * FROM <VIEW> ] - 将 0 条记录写入目标表

从 Airflow DAG 任务调用的 Redshift [Insert into.. select..] 遇到一个奇怪的问题。我们有一个包含 5 个连续任务的 DAG 定义 任务 1:截断 temp_table SQL:`截断

回答 1 投票 0

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.