我一直在使用Dataproc工作流模板用Python编写的气流运营商(DataprocWorkflowTemplateInstantiateInlineOperator)的协助下提交了蜂巢工作。一旦作业被提交了一些名字将被指定为的jobId(例如:job0-abc2def65gh12
)。
因为我没能得到我的jobId试图通过作为的jobId从REST API它是不工作的参数。
我可以获取或的jobId,如果它是不可能的,我可以通过作为的jobId参数?
所述的JobId将作为在metadata
对象Operation
字段是从实例化操作返回的一部分。看到这个[1]如何使用元数据工作的文章。
气流操作者只调查[2]上的操作,但不返回最后的操作对象。你可以尝试添加一回execute
。
另一种办法是为[3]的工作流程完成后使用dataproc REST API。分配给工作流本身的任何标签会被传播到集群和工作,这样你可以做一个列表的工作叫。例如,过滤参数看起来是这样:filter = labels.my-label=12345
[1] https://cloud.google.com/dataproc/docs/concepts/workflows/debugging#using_workflowmetadata
[2] https://github.com/apache/airflow/blob/master/airflow/contrib/operators/dataproc_operator.py#L1376
[3] https://cloud.google.com/dataproc/docs/reference/rest/v1/projects.regions.jobs/list