Apache PDFBox库是一个用于处理PDF文档的开源Java工具。该项目允许创建新的PDF文档,处理现有文档以及从文档中提取内容的功能。 Apache PDFBox还包括几个命令行实用程序。
Apache PDFBox - 已选中的复选框随后设置为未选中
我是 pdfbox 的新手,但我有一个奇怪的问题。我加载这个pdf,其中给定的复选框已经被选中(我看到它打开pdf并处于调试模式),但是当我通过邮件发送这个pdf时,
我正在尝试按照本指南使用 Google Clouds KMS 签署 pdf。使用 pdfsig 测试时我得到: - 签署的全部文件 - 签名验证:摘要不匹配。 Adobe Acrobat 说: 西格纳...
使用 PDFBox,我创建了一个折线图来绘制一些数据,它看起来很像您通过谷歌搜索看到的任何通用折线图。它看起来也与我所添加的折线图相同......
目前,我正在 java.io.IOException:找到了预期的字符串 COSDictionary{COSName{ID}:COSString{node00001218};COSName{K}:.... 我正在使用下面的代码来合并 pdf 和 PDFB 的版本...
我正在使用 java pdfBox 库来验证带有嵌入图像的单页 pdf 文件。 我知道pdf文件本身不包含DPI信息。 然而,具有同等价值的图像......
我用PDF版本2.0.27写了一个去除水印的程序,但是这个方法只能去除内容下面的水印,不能去除上面的水印。是否可以从内容中删除水印并且...
我正在尝试使用对 PDF 哈希进行签名的第三方 API 来对 PDF 文档进行签名。但是,当我使用签名验证工具测试签名的PDF时,遇到以下错误。
PDFBox 3 将大型 pdf 文件中的页面渲染为图像 IllegalArgumentException:容量 < 0
我正在使用 PDFBox 版本 3.0.3 将页面从巨大的 pdf 文件(从 500M 到 1GB)渲染为图像。 这是我用来将页面渲染为图像的代码。 PDDocument 文档 = Loader.loadPDF(pdfFi...
当 pdf 在 PAC3 中运行时,显示“索引超出数组范围”之类的错误。并跳过所有检查?
即使有标签和没有标签也会发生此问题。并跳过 PAC3 的所有检查。如何解决pdf中的这个问题。但如果我在 adobe 中自动标记此页面,那么问题就解决了。我创建了 e...
我需要在给定我已经提取的特定坐标的情况下突出显示现有 PDF 中的一组单词。 我正在使用 Apache 的 pdfbox(最新版本 2.0.8)。 有一个示例文件...
在我的项目中,我需要合并几个pdf文档。每个文档仅包含一页以及多个可选内容组 (OCG)。许多 OCG 未激活并且在 pdf 视图中不可见...
使用 PDFMergerUtility 合并 PDF,而不丢失标签
我正在尝试使用 PDFMergerUtility (PDFBOX 2.0.10) 合并带标签的 PDF(已启用辅助功能)文件,但合并的文档不保留标签! 所有 PDF 均已标记。
PDFBox 3.2:PDF/UA 中图像标签的 PAC 中缺少边界框错误
我正在尝试使用 PDFBox 3.2 创建 PDF/UA 文档,并且我遵循了 @Tilman Hausherr 在这篇 Stack Overflow 帖子中建议的解决方案。我设法标记文本元素和图像,...
如何从PDFBox 2.0.2中的PDDocument中提取字体
我已经在以前的版本中看到了如何执行此操作,如下所示: 如何使用pdfbox提取文本内容的字体样式? 但我认为 getFonts() 方法现在已被删除。我想找回一个...
创建符合 PDF/UA 合规性的 PDF 时出现问题 - PAC 检查器显示“测试对象未标记”
我目前正在生成一个符合 PDF/UA 标准的 PDF 文件。我的主要目标是确保它符合辅助功能标准并通过 PAC(PDF 辅助功能检查器)工具。 亲...
我收到一份 A4 页的文档,每页有 8 个 A7 部分。 我需要从每个页面的每个 A7 区域中提取数据,因为它们是相关的。 有没有可能把8个A7中的每一个A4打碎然后去...
Apache pdfbox - 将 A4 页面拆分为 A7 部分
我收到一份 A4 页的文档,每页有 8 个 A7 部分。 我需要从每个页面的每个 A7 区域中提取数据,因为它们是相关的。 有没有可能把8个A7中的每一个A4打碎然后去...
PAC 2024 验证工具,给我那个错误。 元数据:PDF/UA 标识符丢失 我用 org.apache.pdfbox:pdfbox:3.0.2 如何为 PDDocument 设置标识符?
我有以下问题: 我想将 PDF/A-1A 文档转换为 PDF/A-3A。 原始文档经过 Arobat Reader Pro 验证,因此我可以假设它符合 PDF/A-1A 标准。 我尝试转换...