我想混合一个 LaTeX 文档。我想我会使用 pylatexenc 包来解析文档,然后运行输入结构,混合现有文本并输出结果结构。是否有一个示例程序可以让我自己从中导出其余内容?我尝试过,但很难更改各个元素的内容,几乎就像它们是深层副本一样。
我试过这个,
walker = LatexWalker(input)
nodelist, pos, len = walker.get_latex_nodes()
...
for node in nodelist:
process_node(node)
...
for node in nodelist:
output.write(node.latex_verbatim())
但很难更改各个元素的内容,几乎就像它们是深层副本一样。输出与输入相同:-(
与此同时,我已经为自己找到了解决方案。原始文档是 DOCX。我使用 OSS 工具 docx2tex 将此文档转换为 LaTeX。在TEX方面没有找到解决方案后,我在DOCX方面进行了搜索。使用 Python 包 python-docx,您可以将 DOCX 作为 XML 读入、处理并再次写出。在人工智能的支持下,我开发了一个混合 DOCX 的 Python 脚本。当然,这样也有效。