pdfbox 相关问题

Apache PDFBox库是一个用于处理PDF文档的开源Java工具。该项目允许创建新的PDF文档,处理现有文档以及从文档中提取内容的功能。 Apache PDFBox还包括几个命令行实用程序。

PDFBOX 显示已篡改 PDF 文件的经过验证的签名

使用以下代码“显示签名代码”来验证签名: https://apache.googlesource.com/pdfbox/+/trunk/examples/src/main/java/org/apache/pdfbox/examples/signature/ShowSign...

回答 1 投票 0

如何使用PDFBox识别PDF水印并删除它

我正在尝试使用 Apache PDFBox 库从 PDF 文件中提取除水印文本之外的文本,所以我想先删除水印,剩下的就是我想要的。但不幸的是,PDmetadata 和

回答 2 投票 0

重新加载后无法将 DSS 添加到已签名的 PDF 中

根据我目前的理解,在签署PDF时不允许为时间戳证书添加DSS(如果是签名时间戳)。所以,我尝试先签署 PDF,保存它,然后

回答 0 投票 0

以编程方式填写政府 PDF(XFA 动态)

我需要使用 LiveCycle 生成的 XFA PDF 填写表单。我正在使用 PDFBox 3.0.0-beta1 atm,并且尝试了 iText 4.2.0 和 PDFBox 2.0.28,但没有成功。我对 PDF 所做的任何事情都会导致...

回答 1 投票 0

合并两个 PDF/A 结果也应该是有效的 PDF/A pdfbox

我正在使用 pdfbox 合并两个 PDF/A 现在我的代码如下所示: PDFMergerUtility mergeUtility = new PDFMergerUtility(); 文件 file = new File("example/c.pdf"); 合并U...

回答 1 投票 0

使用 PDFBox 或 iText 将 DocMPD 转换设置为 2 会使 Adobe Reader 禁用对文档进行数字签名的选项

我们正在尝试添加认证签名,以避免在第一次签名后对文档进行进一步修改。但是每当我们将 DocMDP 转换设置为值 2(这应该允许新的

回答 0 投票 0

PDFBox 中的连字

好吧,这几天我一直在使用 PDFBox 而不是 iText 7,它给了我很多新的自由,但我改变的主要原因是我可以在我的 PDF 文档中启用连字。 .

回答 0 投票 0

java.io.IOException:错误:文件结束,PDFBox 的预期行问题

我正在尝试从在浏览器中打开的 PDF 中读取 PDF 文本。 单击“打印”按钮后,以下 URL 在新选项卡中打开。 https://myappurl.com/employees/

回答 1 投票 0

有没有办法让 PDFBox / Tika 忽略字体信息,只提取文本?

我正在使用 Tika 1.28.1 从 PDF 中提取文本以对其进行索引 我遇到了一些 PDF(如果我正确阅读了 Yourkit)内存中有千兆字节的字体信息,它们导致我的应用程序 ...

回答 0 投票 0

如何编辑并保存到多个pdf

有没有办法快速做到这一点或工具,命令来实现这一点。 通过增加并保存到新文件来编辑数字。 我的 pdf 包括编号 1001 将 `1001` 编辑为 `1002` 并保存为 document2.pdf 编辑...

回答 0 投票 0

PDFBox:更改文档中现有字段的页码

如何使用 PDFBox 更改 pdf 文档中现有字段的页码。我尝试了以下代码,但没有用 public static void changePageNumberOfField(PDDocument 文件, ...

回答 0 投票 0

PDFBOX:COSStream已关闭,无法读取。也许它的封闭 PDDocument 已经关闭?

我正在尝试使用 pdfbox 执行签名。在调用 saveIncrementalForExternalSigning 方法之前,我添加了验证信息。 public ByteArrayOutputStream addSignature(PDDocument 做...

回答 0 投票 0

Java 中 pdfBox 中的 setLenient 是否可以安全地修复 PDF 文件?

当我将 pdfParser 中的 setLenient 属性设置为 false 时,我得到以下异常:java.io.IOException: XREF for 5:0 points to wrong object: 4:0 at offset 1013093. 但是,如果我将该标志设置为 t ...

回答 0 投票 0

Java - PDFBbox - FileInputStream 错误和 RandomAccessBufferedFileInputStream

我写了一个简单的代码来比较两个pdf文件,但是在执行过程中我得到了一个错误: 线程“main”中的异常 java.lang.ClassCastException: java.io.FileInputStream cannot be ...

回答 0 投票 0

多次数字签名 pdf 并在签名时向其添加文本/图像

我想要一个pdf由多个用户顺序签名。他们还可以在对文档进行数字签名时添加文本或姓名首字母的图像。我正在使用 pdfbox 版本 2.0.25。 我用过...

回答 0 投票 0

PDFBox - 如何将编码从 WinAnsiEncoding 更改为 Unicode?

我正在尝试找到一种方法可以将 WinAnsiEncoding 更改为 Unicode,我试过这样设置字体, PDDocument 文档 = new PDDocument(); PDPage page = new PDPage(PDRectangle.A4); doc.addPag...

回答 2 投票 0

性能 iText 与 PdfBox(2014)

我正在尝试将 pdf(我最喜欢的书 Effective Java,如果重要的话)转换为文本,我检查了 iText 和 Apache PdfBox。我看到了性能上的巨大差异:使用 iText 花费了 2:521,...

回答 2 投票 0

单个用户签名上的 PDFBox 多个位置

我想问一下,一个用户可以有多个位置签名,而签名面板中只有一个吗? 有可能吗?

回答 1 投票 0

Apache Tika PDFParser 在导入 pdfbox 依赖后返回 NoClassDefFound

我正在尝试开发一个用于提取 pdf 内容的应用程序,并且我已经导入了 apache tika 依赖项, org.apache.tika 我正在尝试开发一个用于提取pdf内容的应用程序,并且我已经导入了apache tika依赖项, <dependency> <groupId>org.apache.tika</groupId> <artifactId>tika-parsers</artifactId> <version>1.12</version> </dependency> 获取 PDFParser 类,它可以独立用于我代码中的任何实例化。 但是,为了处理扫描的文档,我尝试从 Maven 导入 pdfbox 依赖项,但是在 IntelliJ 下载依赖项后,我收到了任何 PDFParser 实例的 NoClassDefFoundError,即使我根本没有从 pdfbox 导入任何类。 <dependency> <groupId>org.apache.pdfbox</groupId> <artifactId>pdfbox</artifactId> <version>2.0.12</version> </dependency> Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/pdfbox/exceptions/CryptographyException at Starter.main(Starter.java:7) Caused by: java.lang.ClassNotFoundException: org.apache.pdfbox.exceptions.CryptographyException at java.base/jdk.internal.loader.BuiltinClassLoader.loadClass(BuiltinClassLoader.java:641) at java.base/jdk.internal.loader.ClassLoaders$AppClassLoader.loadClass(ClassLoaders.java:188) at java.base/java.lang.ClassLoader.loadClass(ClassLoader.java:521) ... 1 more 我在这两种情况下运行的代码都非常直接用于测试。 import org.apache.tika.parser.pdf.PDFParser; public class Starter { public static void main(String[] args){ System.out.println("THIS IS A TEST"); PDFParser stuff = new PDFParser(); } } 使用当前版本,像这样: <dependencies> <dependency> <groupId>org.apache.tika</groupId> <artifactId>tika-core</artifactId> <version>2.7.0</version> </dependency> <dependency> <groupId>org.apache.tika</groupId> <artifactId>tika-parser-pdf-module</artifactId> <version>2.7.0</version> </dependency> <dependency> <groupId>org.slf4j</groupId> <artifactId>slf4j-simple</artifactId> <version>2.0.6</version> </dependency> </dependencies> 这也将导入 PDFBox 依赖项。

回答 1 投票 0

PDFBox-从带有黄色背景的扁平化 PDF 中提取部分

作为 api 响应的一部分,我收到了某些扁平化且只读的 pdf 文档。 我需要验证 pdf 中包含签名的某些部分是否在

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.