我有一个包含 15 亿行和 109 列的表,存储了大约 8 年的销售数据,并且每天都在增长。
那么我如何获取此表中的数据:- 我创建了一个 Spark 作业并部署在 azure 门户上,该作业从 Postgresql 提取数据并复制到 sql server。 现在,在 Sql Server 上,复制成功后,每天都会运行大量存储过程并调用该表来创建后续表。 上述查询目前需要很长时间。有人建议对导致大部分性能问题的大表进行分区,但我有几个问题。
任何人都可以帮我找出我们数据库的最佳选择吗