SQL Server、Spark 作业 [已关闭]

问题描述投票：0回答：0

我有一个包含 15 亿行和 109 列的表，存储了大约 8 年的销售数据，并且每天都在增长。

那么我如何获取此表中的数据：- 我创建了一个 Spark 作业并部署在 azure 门户上，该作业从 Postgresql 提取数据并复制到 sql server。现在，在 Sql Server 上，复制成功后，每天都会运行大量存储过程并调用该表来创建后续表。上述查询目前需要很长时间。有人建议对导致大部分性能问题的大表进行分区，但我有几个问题。