我被允许阅读pdf文本,并做了一些提取文本的工作。我正在使用iTextSharp来阅读PDF。这里的问题是PdfTextExtractor.GetTextFromPage没有给我页面的所有内容。对于前
在以上PDF中,我<>阅读以蓝色突出显示的文本。我看不懂的其余字符。以下是执行上述操作的行 `string filePath = "myFile path";
PdfReader pdfReader = new PdfReader(filePath);
for (int page = 1; page<=1; page++)
{
ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
string currentPageText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);
}`
这里有什么建议吗?
我在SO中经历了很多查询和解决方案,但并不特定于此查询。
我被允许阅读pdf文本,并做了一些提取文本的工作。我正在使用iTextSharp来阅读PDF。这里的问题是PdfTextExtractor.GetTextFromPage不能给我全部...