pdfbox 相关问题

Apache PDFBox库是一个用于处理PDF文档的开源Java工具。该项目允许创建新的PDF文档,处理现有文档以及从文档中提取内容的功能。 Apache PDFBox还包括几个命令行实用程序。

如何使用 PDFBox 2.0.27 将免费字体替换为部分/所有标准 14 字体?

我们使用 PDFBox 2.0.27 在 Linux 上用 Java 打印 PDF 文档。我们想使用免费字体(如 Linux Libertine for Times-Roman)来渲染图像。有没有办法映射14个标准...

回答 0 投票 0

PDFBox IOException:文件结尾,预期行

我目前正在尝试使用 PDFBox 和 Selenium 从已经上传并通过链接访问的 PDF 中获取文本。 我用这个作为来源:http://www.seleniumeasy.com/selenium-tutori...

回答 2 投票 0

将 PDF 文件转换为图像

我想将 PDF 文档转换为图像。我正在使用 Ghost4j。 问题:Ghost4J 在运行时需要 gsdll32.dll 文件,而我不想使用该 dll 文件。 问题一:有没有办法,在ghos...

回答 7 投票 0

在 java 中使用 Pdfbox 从 pdf 文件中提取文本时如何获取行号?

有没有办法让我使用pdfbox提取的文本中没有行? 我没有使用 .getNumberOfPages() 方法的页面。 我正在遍历页面以逐页提取文本...

回答 0 投票 0

使用 Java 库压缩 PDF

我正在构建一个聊天平台并正在实施上传附件。 为此,我需要使用几个库来压缩文件(pdf、图像、视频)。 我正在使用 lambda 来执行此操作。 图像压缩...

回答 0 投票 0

java pdfbox - 文档自签名后已被更改或损坏

当我尝试使用带有子过滤器的 pdfbox 为 etsi.cades.detached 签署文档时,出现以下错误 我正在从 CSC 获取证书信息和签名哈希。这是我的...

回答 0 投票 0

在Spring Boot中使用PDFBox时出现类型定义错误

当我试图在Spring Boot应用程序中运行PDFBox时,我得到了这个错误:com.farterxml.jackson.databind.exc.InvalidDefinitionException。直接的自引用导致循环(通过...

回答 1 投票 0

PDFBox在Android Studio上提取文本连接符 "fi"、"fl "的问题。

我正在使用这个https:/github.comTomRoushPdfBox-Android Studio上的PDFBox库从一个PDF文档中提取文本。下面是我正在做的事情。File pdf_file = new File(file_path); 创建...

回答 1 投票 1

Crash on line: PDDocument.load(file)

我有以下简化的代码。PDFTextStripper pdfStripper = new PDFTextStripper(); PDDocument doc; String text = ""; try { File textFile = new File("C:UsersuserDesktopPDF-test.txt"); ...

回答 1 投票 0

使用Selenium-WebDriver和PDF-Box从一个URL中读取PDF。

我试图使用硒-web驱动和Pdfbox API来读取pdf中的文本。如果可能的话,我不想下载文件,而只想从网上读取pdf,只想把pdf的文本读到......

回答 1 投票 0

java.io.IOException.COSStream已被关闭,无法读取。COSStream已被关闭,无法读取。也许它的外层PDDocument已被关闭?

我试着用apache PDFBox保存PDF文件,但出现了java.io.IOException.COSStream has been closed and cannot be read的错误。COSStream has been closed and cannot be read. 也许是它的外层PDDocument已经被关闭了?这到底是怎么回事?

回答 1 投票 0

无法理解如何使用PDFBox

我正试图创建一个PDF文件,文件中有很多文本框和来自另一个类的文本框。我正在使用PDFBox。好的,创建一个新文件很容易,写一行文字也很容易。 ...

回答 2 投票 9

Apache PDFBox - Adobe Acrobat提示保存。

我使用Apache PDFBox 2.0.16版本来添加分页到一个现有的PDF文件。我的方法工作得很好,生成的PDF也很好,但是,当我用Adobe Acrobat Reader打开文件时,如果我尝试... 然而,当我用Adobe Acrobat Reader打开文件时,如果我试着... ...

回答 1 投票 1

如何使PDF显示文件名而不是标题使用程序?

https:/community.adobe.comt5acrobatdefault-to-show-file-name-vs-title-of-doc-when-converting-from-word-to-pdftd-p9673161我想为一堆PDF文件显示文件名而不是标题。I ...

回答 1 投票 0

是否可以用java在PDF或Word文档中重新搜索文本?[已关闭]

我想用Java用正则表达式搜索word文档或pdf文档中的文本。这可能吗?如何做到这一点?例如,PDFDOC是这样的。(54) 关于键盘...

回答 2 投票 3

使用apache pdfbox进行分离式签名

我们正在尝试使用apache pdfbox的分离签名功能。我们尝试了两种方法。1. 使用证书文件和私钥进行签名:在这种情况下,文档得到完美的签名。...

回答 1 投票 0

用api提供的签名哈希值签署PDF文件

我正试图用PDFBox和第三方签名供应商来签署一个pdf。我的程序是 从用户输入中获取pdf 创建一个包含pdf内容的PDDocument 创建一个... ...

回答 1 投票 0

从PDF文档中提取文本并生成结构化数据。

我能够成功地从pdf的所有页面中提取文本,但无法在结构化数据中生成。但无法在结构化数据中生成.指导我,如果有人来acorss这样的专业知识。代码:包pdfboxreadfromfile; ...

回答 1 投票 0

从pdf中提取段落

我正在对一本pdf电子书进行主题建模,需要逐段提取文本。为此我使用了apache pdfBox,它可以有效地从pdf中提取文本。PDFParser parser; PDFTextStripper ...

回答 1 投票 0

用PDFBox 2.0.5创建PDF按钮,在页面上显示另一个按钮。只有最后创建的一组按钮才是最有效的

这段代码的目标是在页面上有一个缩略图,当鼠标悬停在上面时,它会以全尺寸显示图像。这里的代码工作的主要注意事项是,只有最后 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.