Pentaho BI Suite是一个开源商业智能套件,具有集成的报告,仪表板,数据挖掘,工作流和ETL功能。它主要用Java编写。
Pantaho MySQL 8 连接错误 找不到驱动程序类 'org.gjt.mm.mysql.Driver'
在将 MySQL 5.8 的 ETL 脚本升级到 MySQL8 升级时,一旦我将 data-integration/lib jar 更新为 mysql-connector-java-8.0.xx.jar,它就开始出现以下错误。
我最近从 SourceForge 上下载了 Pentaho Data Integration http://sourceforge.net/projects/pentaho/files/Data%20Integration/ 我正在尝试让它连接到 MongoDB。每个教程我...
Pentaho Kettle 在 JAVA 应用程序中嵌入转换错误处理
我正在使用包含“数据验证器”和“用户定义的Java表达式”步骤的简单转换来测试kettle-sdk-embedding-samples。 其中一项测试包括
我想使用 pentaho 数据集成从 Rest API 访问数据并将结果保存到表中。 我正在使用以下步骤: 生成行步骤 休息客户端 JSON 输入 选择值 表...
我正在配置存储库以与 Pentaho 一起使用。目前我有一个简单的脚本,它创建一些环境变量(例如 KETTLE_HOME),然后调用/打开提供的 Spoon 客户端。 哈...
在我的pom中我有这个依赖 org.pentaho.reporting.engine 经典核心 9.2.0.0-...
如何获取@odata.nextLink等特殊字符的json路径":"https://graph.microsoft.com/v1.0/users
在 Pentaho Spoon 中,我尝试构建将从 Azure AD 读取数据的转换,然后将此数据推送到另一个应用程序。 现在我面临的问题是分页...
当您在 Pentaho DI 中使用作业的 START STEP 安排作业时,如何取消作业安排或终止调度程序?
我已安排一项作业每天使用作业的“开始步骤”运行,而不使用“计划预设”,现在我无法在计划作业中找到它,但该作业每天在特定日期运行,我想
我知道我的数据库表名称,它正在作业内的 Pentaho PDI 转换中的一个转换中使用。但我不知道同一张桌子还用在其他地方
如何在Windows中的Pentaho(PDI)中使用“执行进程”来运行anaconda python?
我将通过在pdi中和特定的anaconda环境中“执行一个进程”来运行一个python程序。 这是我的解决方案,但不起作用: run_on_win = "C:\Users\x\Anaconda3\Scr...
是否可以使用Pentaho将文件从S3存储桶的一个文件夹移动到S3存储桶的另一个文件夹?
我正在尝试搜索一个组件,它可以帮助我将文件从一个S3存储桶文件夹移动到Pentaho数据集成中的另一个文件夹。
我有一个要求,传入的 XML 必须被分解并加载到数据库中。 所有元素都有各自的表格。 传入的 XML 看起来像这样: 我有一个要求,传入的 XML 必须被分解并加载到数据库中。 所有元素都有各自的表格。 传入的 XML 看起来像这样: <root> <creditreport> <data1> <A>val1</A> <B>val2</B> </data1> <data2> <C>val3</C> <D>val4</D> </data2> <data3> <E>val5</E> <F>val6</F> </data3> <data3> <G>val7</G> <H>val8</H> </data3> </creditreport> </root> 现在在 Kettle 中,我正在设计一个通用框架,它可以获取 XML 并将其分解到数据库中。 我正在使用“获取 XML 数据”组件来读取 XML。 我已将“循环 Xpath”定义为 root/creditreport,然后我将字段一一读取为: name xpath Element ResultType A data1 Node Valueof B data1 Node Valueof ..... ..... ..... E data3 Node Valueof ..... ..... G data3 Node Valueof 但问题是,它只粉碎了第一行并丢失了第二行。我可以理解原因,因为 XPATH 循环仅到 。 如果我将“xpath循环”定义为“root/creditreport/data3”,那么元素“data3”的问题就得到解决,但还有其他元素也可以重复,然后我将再次站在问题的起点。 有什么建议吗!! 如果父节点(dataX)和子节点(A、B、C 等)确实是唯一/连续的,您可以进行一个非常通用的设置: 使用 /root/creditreport/*/* 作为 xpath 循环路径 手动设置这样的字段: 这应该给你一个像这样的输出: 从这里您可以根据需要对数据进行非规范化或其他处理。请注意,我已经为父级别的节点添加了序列号,因此您可以区分第一个 Data3 和第二个,等等。 另一方面,如果您的 dataX 节点都具有相同的子节点(A、B A、B 而不是 A、B C、D 等),您可以使用 /root/creditreport/* 作为 xpath 循环路径并跳过父节点字段,配置通常你的值节点 A 和 B。 以下是定义和输出。所有字段都是相对于当前节点 (.) 定义的。 我也有同样的问题。如何在 Loop xpath 中循环 xml 元素。 可以请指教吗
我需要通过命令行调用jobs/trans来运行,因此我使用pan.sh和kitchen.sh来触发它们运行。 然而,每当它被触发时,它都会创建一个单独的 JVM。我正在考虑...
通过命令行在 Certe Server 上运行 Pentaho 作业或转换
我需要通过命令行调用jobs/trans来运行,因此我使用pan.sh和kitchen.sh来触发它们运行。 然而,每当它被触发时,它都会创建一个单独的 JVM。我正在考虑...
如何在Pentaho DI中添加新列到流中,不阻塞流,新列值不是恒定的
我在 sv 节点的主流中有这样的管道结果,如下所示 以及图中顶部的节点辅助节点的结果 结果我应该得到这样的结果 如何获得像
无法在 Pentaho Data Integration 9.2 中运行作业(kjb)
我尝试使用pentaho 9.2运行作业,但在按厨房评论运行时没有选择作业 ./kitchen.sh -rep=repo1 -file=/var/lib/jenkins/project/path/etl/Job1.kjb Job1.kjb 包含多个...
使用Pentaho ETL工具读取VarBinary(Max)
尝试从存储在 VarBinary(max) 中的 SQL Server 中提取数据并使用 pentaho ETL 工具将其存储到文本文件中。提取数据时获取无效数据,该数据存储为
kettle/status 中 xml=n 的 java.lang.NullpointerException
我正在尝试通过水壶/状态页面检查我的作业状态,但是,我收到以下错误。使用xml=y参数,页面显示状态列表。 java.lang.