我喜欢使用PDFBox从大PDF中提取单个页面。我所有的“真实” PDF文件都位于一个目录中。因此,如果我提取一页,我想将此页保存到另一页的目录中。 (或将其传送到标准输出)
问题:有没有一种方法来定义输出目录或输出前缀,例如-prefix=/tmp/pdf-snipped-
带有选项PDFSplit的PDFBox接缝可将拆分的页面存储在与源pdf相同的目录中。但这不是很好。
顺便说一句,在拆分之前,不能复制源pdf,因为其中很大(超过1 GB)
回答我自己的问题:
看起来,没有选择(也没有隐藏的)来定义输出前缀或输出文件名。
因此,我决定下载并更改PDFbox源代码,并添加了一个新选项(“前缀”)来定义存储已截取的PDF的路径或定义输出名称。
如果您有同样的问题,那么这就是我要走的路:
1。从svn下载源:http://pdfbox.apache.org/downloads.html#scm并根据需要在此文件中更改代码:
{PDFBOX-source-root}/pdfbox/src/main/java/org/apache/pdfbox/PDFSplit.java
2。使用maven构建自己的PDFBox版本:http://pdfbox.apache.org/building.html
选项-outputPrefix可用于定义要保存输出的位置。