我有来自 Hive 表的数据,我想将数据导出到几个平面文件中,按行分区,每个目标上的行数相等/几乎相等。
有什么方法可以动态地将数据分区到多个平面文件中,例如:
我可以描述如何在 PowerCenter 或 Informatica Cloud 中完成此操作(如果您使用其中任何一个)。
简短的回答是:
File Name
端口 - 这将使动态文件名成为可能Transaction Control
标志的 TC_COMMIT_BEFORE
转换 - 这将关闭当前文件并将写入重定向到新文件(在 File Name
端口值中指定名称)。这将创建多个文件。