对于一个项目,我们需要调查 IBM Data Stage 的现有安装,在大量作业中执行大量 ETL。
作业流程图包含许多用作源(MSSQL 和 Oracle)以及目标(主要在 Oracle 中)的表。
我现在的问题是
如何找到某个 Data Stage 项目中所有作业使用的所有数据库表?
我查看了“工具”-“高级查找”,在那里我可以看到所有“表定义”。但是,作业中实际使用的大多数表不会显示在那里,因为它们被定义为 Data Stage 所谓的“并行作业”,这实际上是针对数据库表的 SQL 查询。
我对查找作业正在加载的目标表特别感兴趣。
所以说白了,我希望能够回答“哪个作业加载表 XY?”这个问题。
如果这是不可能的,则可以使用自动提取作业使用的所有 SQL 语句的方法。
我们可以访问 IBM Websphere Data Stage 和 Quality Stage Designer 8.1
导出作业会创建一个文本文件,详细说明作业的用途。在文本编辑器中打开导出文件,您应该能够通过简单的搜索找到 SQL 插入。首先搜索 SQL 关键字,例如“INTO”和“FROM”。
编辑:或者,如果使用的每个表都是通过导入表定义来定义的,则您应该能够在文件夹中找到其类型的表定义。然而,这不会使表的使用位置和方式变得明显(哪个作业,插入或选择?),所以我建议第一种搜索导出文件的方法。