pdfbox 相关问题

Apache PDFBox库是一个用于处理PDF文档的开源Java工具。该项目允许创建新的PDF文档,处理现有文档以及从文档中提取内容的功能。 Apache PDFBox还包括几个命令行实用程序。

Adobe Acrobat / Python PDF输出不同

我注意到当我使用OCR将扫描的PDF文档转换为文本时,在这种情况下是Adobe Acrobat Pro,根据我提取数据的方式,我得到的输出非常不同。在里面 ...

回答 1 投票 1

签署文档时PDFBox 2.0.8问题

我正在尝试使用此方法签署pdf,但获取没有大小的文档:public static void sign(PDDocument doc)抛出KeyStoreException,NoSuchAlgorithmException,CertificateException,...

回答 1 投票 0

我在哪里可以获得Adobe-Identity-UCS cmap文件?

我有一个pdf文件,无法通过pdfbox或itext7提取文本。该字体由Identity-H和Adobe-Identity-UCS编码。 ToUnicode的详细信息如下。 / CIDInit / ProcSet ...

回答 1 投票 0

不知道如何运行此pdfbox注释示例

您好我发现了使用注释的pdfbox示例:https://svn.apache.org/repos/asf/pdfbox/trunk/examples/src/main/java/org/apache/pdfbox/examples/pdmodel/AddAnnotations.java我尝试运行它......

回答 1 投票 0

使用Apache Batik将SVG转换为PNG,然后使用PDFBox附加到PDF而不保存图像

因此,标题说我正在寻找一种方法,使用Apache Batik将SVG转换为PNG,然后使用PDFBox将此图像附加到PDF文件,而无需在任何地方实际创建svg和png。目前我......

回答 2 投票 1

转换为PNG时,Apache PDFBox删除水平线

我有一个PDF,当我将它渲染到png时,它会删除水平和垂直线。这是PDF及其外观:https://drive.google.com/file/d/1sAXwnaoZ -...

回答 1 投票 2

由于某种原因,第一页上的背景颜色不正确

文件示例:此处问题:我正在尝试确定文本是否在页面上可见。为了达到这个目的,我为每个Fill命令保存了它的路径+颜色,如下所示:public class FillNonZeroRule ...

回答 1 投票 1

如何从左下角到左上角更改pdf页面中文本的坐标

我正在使用PDFBOX和itextsharp dll并处理pdf。这样我就可以在矩形内得到文本的文本坐标。使用itextsharp.dll提取矩形坐标。 ...

回答 2 投票 1

如何从pdfBox导入ImageIOUtil和PDFText2HTML类

我正在尝试获取远程pdf文件并对其执行某些操作。为此,我使用PDFBox。我无法抓住工具包以便导入ImageIOUtil和PDFText2HTML我添加了...

回答 1 投票 0

PDFbox 1.7.0 - 如何在使用PDFBox添加新图像时保留现有图像?

我正在使用PDFBox 1.7.0(由于生产服务器中的旧版本,我没有选择版本)。我正在尝试将图像添加到已有徽标的现有PDF中。当我添加新...

回答 2 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.