我正在尝试使用 Google Cloud Platform 构建数据摄取管道 (ETL) 我有 python 脚本,可以下载公共数据,将其上传到云存储,并对这些数据执行转换并将其上传到 BigQuery 这些脚本必须按计划运行(每小时和每天) 我们正在考虑两种选择来实现这一目标:
选项 1:
选项2:
这两个选项总体来说哪个更好? 两种方法之间的成本、可靠性和效率是否有比较?
已尝试这两种方法来构建数据摄取管道,并且它们按预期工作
我有更好的建议:
这里,对该提案的一些解释: