如何在Linux中将docx转换为带有特殊字符(如刻度线和十字线)的pdf

问题描述 投票:0回答:1

我正在开发我的项目,当我尝试将文档转换为 pdf 时遇到问题。当我尝试在 Linux 中将文档转换为 pdf 时,特殊字符会转换为不同的字符,如示例中所示。

This is docs image 这是文档

[when converted to pdf they become like this]

(https://i.sstatic.net/2fKRaE4M.png) 转换为pdf后。

我正在使用以下代码将文档转换为 pdf。

enter image description here

python linux pdf docx python-docx
1个回答
0
投票

像 PDF 这样的格式的主要问题之一是它被设计为跨“设备”忠实,并且在 Unicode 强制执行唯一编号之前有很多方法可以做到这一点。因此,我们让 WinAnsi 和 MacAnsi 生成具有相同编号的变体。

因此早期 PDF 术语中的二进制字符数字,即当前版本不是 UTF-8,而是多个其他范围。

您的源文档正在使用这些 Windows 设备编号

char(251)char(252)char(253)char(254)char(255)
enter image description here

这些在数学上与较低的单字节相同

\xFB\xFC\xFD\xFE\xFF
在另一种字体中,这些将是
û ü ý þ ÿ

因此,答案很明显,错误的字体未在非 Windows 设备上应用或可用。

© www.soinside.com 2019 - 2024. All rights reserved.