我正在尝试使用Cloud Composer编写我的第一个Airflow作业。我的DAG有三个任务,第一个成功完成,但第二个任务似乎失败,似乎发出任何失败错误消息。我在第二个任务中使用PythonOperator
。被调用的函数执行长时间运行的查询并轮询直到查询完成。查询完成后,我收到一条消息,说明数据已输出到正确的表,但随后Airflow将任务视为失败并再次重试该任务。
我对DAG的default_args
看起来像这样:
default_args = {
'owner': 'airflow',
'depends_on_past': False,
'start_date': today.strftime("%Y-%m-%d"),
'email': ['[email protected]'],
'email_on_failure': True,
'email_on_retry': False,
'retries': 1,
'retry_delay': timedelta(minutes=1),
'dagrun_timeout': timedelta(minutes=30)
}
编辑:
这是我的Python可调用和PythonOperator。 run_query
callable在Stackdriver日志中生成输出并指示实际函数完成,但任务失败。
def run_query(**kwargs):
ti = kwargs['ti']
creds = ti.xcom_pull(key='key value 1', task_ids=t1_id)
service = adh.get_service(creds)
return adh.start_saved_query(service,
kwargs['customer_id'],
kwargs['query_name'],
kwargs['start_date'],
kwargs['end_date'],
kwargs['project'],
kwargs['dataset'],
kwargs['table'],
parameters=kwargs['parameters'])
run_adh_query = PythonOperator(
task_id="task2",
provide_context=True,
python_callable=run_query,
dag=dag,
trigger_rule='all_success',
op_kwargs={
'customer_id': 01234,
'query_name': 'queryName',
'start_date': start_date.strftime("%Y-%m-%d"),
'end_date': end_date.strftime("%Y-%m-%d"),
'project': adh_project,
'dataset': adh_dataset,
'table': adh_table,
'parameters': {
'CONV_START_DATE': {'value': conv_start_date.strftime("%Y-%m-%d")},
'CONV_END_DATE': {'value': end_date.strftime("%Y-%m-%d")},
'LOOKBACK_DAYS': {'value': str(lookback_days)}
}
}
)
我非常感谢任何提示!
我没有在您的代码中看到任何错误处理。
当长时间运行的查询和轮询失败时,引发AirflowException,这将导致任务立即移动到失败状态。
from airflow import AirflowException
ValueError可用于失败和重试