我们正在运行多个流数据流管道,这些管道总是最终挂起,需要在运行大约25天后重新启动。
同样的事情发生在这里。我们在20天前挂了一个数据流作业,它从pubsub获取数据,导致我们的一个客户丢失了数据。
昨天我们重新启动了数据流作业,它已经被卡住了。我们在几个客户项目上运行此作业的多个副本,所有其他副本运行正常,这似乎表明gcp数据流中存在一些错误。
此数据流作业使用Apache Beam SDK for Java 2.6.0在us-east1中运行
这个问题似乎与https://status.cloud.google.com/incident/cloud-dataflow/19001有关
关于如何解决悬挂问题的任何想法?
问候