如何调试Google Cloud Dataflow流引擎中断?

问题描述 投票:0回答:1

我们正在使用Streaming Engine选项在Google Cloud Dataflow中运行一些流处理。今天早上缺少一些数据,因此我尝试进行一些故障排除。我发现的唯一一件事似乎是重新启动了工作程序(请参阅日志文件的屏幕截图)。没有日志显示任何错误或异常。

Dataflow log

我们对GCP来说还很陌生,所以我们不太了解我们的方法。有什么方法可以找到工作程序重新启动的根本原因?还是仅仅是基础设施错误?

google-cloud-platform google-cloud-dataflow apache-beam google-cloud-stackdriver
1个回答
0
投票

您是否查看了DataFlow样条线写入的上游数据源?如果您的同步处理无法跟上您的DataFlow工作,那么请看一下这篇文章,它似乎提出了一种解决方案:https://medium.com/google-cloud/restarting-cloud-dataflow-in-flight-9c688c49adfd

您提到的行为似乎符合以下两种情况:

运行缓慢的管道或缺少输出。如果管道运行缓慢或长时间运行而没有报告结果,则可以检查流数据源和接收器(例如Pub / Sub)的配额。还有某些转换比其他转换更适合于大容量流传输管道。

由其他Google Cloud服务的暂时故障引起的错误。您的管道可能会由于临时中断或数据流所依赖的Google Cloud Service中的其他问题而失败,例如Compute Engine或Cloud Storage。

请参阅:https://cloud.google.com/dataflow/docs/guides/troubleshooting-your-pipeline

希望这会有所帮助。

© www.soinside.com 2019 - 2024. All rights reserved.