[当我使用itextsharp(PdfReader)将pdf文件传输到文本框时,我所有的pdf文本如下所示:w(长空格)w d(长空格)w d
((我将这段代码从一个视频复制到我自己的项目中。我不知道它是如何工作的。因此,请考虑到我什么都不知道,建议我进行更改。)
string strText = string.Empty;
PdfReader reader = new PdfReader(path + dlg.FileName);
for (int page = 1; page <= reader.NumberOfPages; page++)
{
ITextExtractionStrategy its = new iTextSharp.text.pdf.parser.LocationTextExtractionStrategy();
String s = PdfTextExtractor.GetTextFromPage(reader, page, its);
s = System.Text.Encoding.UTF8.GetString(System.Text.ASCIIEncoding.Convert(System.Text.Encoding.Default, System.Text.Encoding.UTF8, System.Text.Encoding.Default.GetBytes(s)));
strText = strText + s;
txtPdf.Text = strText;
}
reader.Close();
这里是您的情况的示例:
...
s = System.Text.Encoding.UTF8.GetString(System.Text.ASCIIEncoding.Convert(System.Text.Encoding.Default, System.Text.Encoding.UTF8, System.Text.Encoding.Default.GetBytes(s)));
strText = (strText + s).Replace(" ", string.Empty);
txtPdf.Text = strText;
...
也请检查docs以开始使用。