我们想使用pan.sh来执行多个水壶转换。在探索脚本之后,我发现它在内部调用了在PDI中运行的spoon.sh脚本。现在的问题是每次新的转换开始时都会为它的执行创建一个单独的JVM(通过.bat文件调用),但是我想将它们分组以使用单个JVM来克服多个JVM对批处理的内存限制服务器。
有人可以指导我如何实现这一目标或与我分享文档/资源。
谢谢你的出色工作。
使用Carte。这正是这个用途。您可以启动服务器(如果您愿意,可以在本地方框上),然后将作业提交给它。一个JVM,一个堆,共享资源。
这样做的好处就是可扩展性,所以当你的盒子变得太忙时,只需添加另一个,也可以使用carte并开始将一些作业发送到另一台服务器。
这里有一个古老但仍然最新的博客:
http://diethardsteiner.blogspot.co.uk/2011/01/pentaho-data-integration-remote.html
以及pentaho网站上的doco。
启动服务器非常简单:
carte.sh <hostname> <port>
还有一个状态页面,您可以使用它来查询您的carte服务器,因此如果您有一组服务器,您可以选择一个安静的服务器来发送您的作业。