在提取pdf内容时保存textformat

问题描述投票：0回答：1

我目前正在尝试用现有的pdf替换某些单词，这些单词具有某些格式[如表和东西]。我通过使用ITextSharp / c＃提取单词并保存到字符串中成功替换了单词。后记，使用正则表达式应用替换操作。当我将此结果保存到pdf文件时，不保存原始格式。

我已尝试上传到Google云端硬盘并将文件转换为doc，但格式搞砸了。我正在考虑使用Acarbat SDK，但安装的当前版本似乎搞砸了，不会让我运行javascript

简而言之：我想知道Itextsharp是否具有提取文档格式的功能，如css文件或是否有更好的方法来执行此操作。

1个回答

0
投票

你有没有看过iText（http://developers.itextpdf.com/examples/itext-action-second-edition/chapter-15）修改页面内容和结构的例子？这些示例是Java中的，但转换为C＃应该相对简单。

由于您的文档格式化为表格，这听起来像是最有前途的方法，因为更改文本不应该移动页面上的其他文本。

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.