在寻找使用 Mongo API 将本地 MongoDB 迁移到 Azure CosmosDB 的服务时,我们遇到了名为 Azure Data Bricks 的服务。我们总共有 186GB 的数据。我们需要以尽可能少的停机时间迁移到 CosmosDB。我们如何才能提高数据传输速率呢?如果有人可以对 Azure 提供的基于 Spark 的 PaaS 提供一些见解,那将会非常有帮助。 谢谢你
您是否参考过我们文档页面上给出的文章?
一般来说,您可以假设迁移工作负载可以消耗整个配置的吞吐量,配置的吞吐量将给出迁移速度的估计。您可以考虑在迁移时增加 RU,然后再减少。
可以通过这些配置来调整迁移性能:
Number of workers and cores in the Spark cluster
maxBatchSize
Disable indexes during data transfer