我正在努力寻找一种将文本可搜索 PDF 转换为图像 PDF 的方法。 通常,您可以在 Adobe Reader 上手动实现这一点,方法是选择“打印为图像”选项,将 PDF 打印到文件。这样,所选 PDF 的所有页面都将转换为图像。
我需要一个Linux命令行程序来快速获得相同的结果,因为我需要处理大量的PDF文件。
常用称呼:
lp -d PRINTER_NAME "$FILENAME"
无法将文本 PDF 转换为图像 PDF,而且我找不到任何可用选项来执行此操作。 你知道我能做什么吗?或者你建议我一个更好的工具? 谢谢
我遇到了同样的问题,我寻找解决方案,但只找到了一个:一个名为 Okular 的软件(https://okular.kde.org/ - 此时,对于 Debian,版本 17.12.2)。
不幸的是,这不是命令行。
要将 PDF 文本转换为图像(或类似图像),您需要完成以下步骤:
打印窗口将打开,然后您必须选择打印机“打印机到文件(PDF)”。然后单击“选项”窗口的按钮。现在,选择“PDF 选项”选项卡并选中“强制光栅化”选项。
要完成,请单击“打印”按钮。
Ghostscript(Debian/Ubuntu apt 软件包:ghostscript,测试版本 10.01.1)提供 PDF 输出设备,默认情况下将输出分辨率为 720 DPI 的“光栅化* PDF(图像 PDF)” :
gs -sDEVICE=pdfimage24 -o output.pdf input.pdf
输出分辨率可以使用 -r...
选项进行配置。例如,要创建低分辨率 150 DPI 光栅化图像 PDF:
gs -sDEVICE=pdfimage24 -r150 -o output-dpi-150.pdf input.pdf
请注意,低分辨率设置上的 Ghostscript 将为基于矢量的字体创建像素化结果,因为它不使用内部放大/抗锯齿:例如黑色文本将输出为黑色或白色像素,中间没有灰色褪色。
为了利用抗锯齿功能提高低分辨率 PDF 的质量,请让Ghostscript 以高 DPI 值渲染,然后使用 -dDownScaleFactor=...
将其缩小到所需的分辨率:
gs -sDEVICE=pdfimage24 -r1200 -dDownScaleFactor=8 -o output-internal-1200-dpi-final-150-dpi.pdf input.pdf