我的情况是:
我想安排定期将数据从 Cloud SQL 更新到 BigQuery。
Cloud SQL 上的表的数据会定期更新,并且可以编辑该表中的旧数据。该表大约有 20 列。
说到更新计划,我希望在 Cloud SQL 和 BigQuery 中的表之间同步。
如何在 BigQuery 中添加新数据、更新最近编辑的数据以及删除 Cloud SQL 中不再存在的数据?
目前我每次去更新时间表时都使用覆盖此表的方式。
我仍然没有一个很好的解决方案来在查询时保存数据。
为此,您可以将 Cloud SQL 设置为 Big Query 上的外部数据源。
这样,数据将在 Big Query 中自动保持更新,因为它驻留在云 SQL 中。 这实际上会降低您的账单金额,因为数据不会重复,但对外部数据源执行的查询比数据驻留在 BigQuery 中时要慢一些。
要执行此操作,您可以按照指南此处进行操作,我正在处理这篇文章中的一般步骤。
project-id:location-id:instance-id
datastream。 设置起来非常简单,并且几乎实时更新,并且非常有弹性。 如果您的客户已经拥有它或愿意为其付费,请不要再犹豫了。