在提取pdf内容时保存textformat

问题描述 投票:0回答:1

我目前正在尝试用现有的pdf替换某些单词,这些单词具有某些格式[如表和东西]。我通过使用ITextSharp / c#提取单词并保存到字符串中成功替换了单词。后记,使用正则表达式应用替换操作。当我将此结果保存到pdf文件时,不保存原始格式。

我已尝试上传到Google云端硬盘并将文件转换为doc,但格式搞砸了。我正在考虑使用Acarbat SDK,但安装的当前版本似乎搞砸了,不会让我运行javascript

简而言之:我想知道Itextsharp是否具有提取文档格式的功能,如css文件或是否有更好的方法来执行此操作。

c# pdf itext
1个回答
0
投票

你有没有看过iText(http://developers.itextpdf.com/examples/itext-action-second-edition/chapter-15)修改页面内容和结构的例子?这些示例是Java中的,但转换为C#应该相对简单。

由于您的文档格式化为表格,这听起来像是最有前途的方法,因为更改文本不应该移动页面上的其他文本。

© www.soinside.com 2019 - 2024. All rights reserved.