Informatica Powercenter 中哪一个性能更好?使用排序器转换或在源限定符上添加排序端口数?

问题描述 投票:0回答:1

我在 Informatica Powercenter 中有一个映射,它组合了两个来源的数据。一个源拥有大约 2200 万行数据,而另一个源拥有超过 3.89 亿行数据。如果我添加排序器转换,性能会更好吗?还是在源限定符中添加排序端口数会更好? 另外,哪些因素使一种方法优于另一种方法(在排序器转换与在 SQ 中添加排序端口数量的情况下)?

informatica informatica-powercenter
1个回答
2
投票

如果两个表都来自同一个数据库,毫无疑问 - 使用排序端口数在 SQ 中排序。

Informatica 排序器将整个数据导入 infa 服务器,然后进行排序。因此,对 300M 的结果数据进行排序将花费大量的时间和资源。
现在,在源中连接 389 M 和 22M 表并在源本身中对结果进行排序将花费更少的时间和资源。 Informatica 无需将任何数据带入其服务器。

现在,如果它们来自不同的数据库,那么,在源限定符中对它们进行排序将在加入时带来性能提升。您必须使用连接器将它们连接起来才能获取整个数据集。我认为如果您的排序键与连接键相同,并且您不必使用排序器再次排序,则数据顺序将相同。问题是加入两者都需要时间,但它会比使用 infa 排序器排序相对更快。

© www.soinside.com 2019 - 2024. All rights reserved.