我需要在.net core 6应用程序中读取PDF图像。我正在尝试使用 itext7 和 pdfocr
但我收到错误 严重性代码 说明 项目文件行抑制状态 警告 NU1701 包“itext.pdfocr.api 3.0.1”已使用“.NETFramework,版本 = v4.6.1,.NETFramework,版本 = v4.6.2,.NETFramework,版本 = v4.7,.NETFramework,版本 = v4 恢复” .7.1, .NETFramework,Version=v4.7.2, .NETFramework,Version=v4.8, .NETFramework,Version=v4.8.1' 而不是项目目标框架 'net6.0-windows7.0'。该软件包可能与您的项目不完全兼容。
string pdfPath = "path/to/your/pdf/document.pdf";
int pageNumber = 1; // Replace with the page number containing the image
try
{
PdfDocument pdfDocument = new PdfDocument(new PdfReader(pdfPath));
PdfOcrTextExtractionStrategy strategy = new PdfOcrTextExtractionStrategy();
// Language and other configuration for OCR
PdfOcrPdfDocument pdfOcrDocument = new PdfOcrPdfDocument(pdfDocument, new DefaultPdfOcrEngine(), new PdfOcrTesseract4Configuration());
// Extract text from the specified page
ITextExtractionStrategy extractionStrategy = new FilteredTextEventListener(new LocationTextExtractionStrategy(), new TextRegionEventFilter(pageNumber));
String extractedText = PdfTextExtractor.GetTextFromPage(pdfOcrDocument, pageNumber, extractionStrategy);
Console.WriteLine("Extracted Text:");
Console.WriteLine(extractedText);
pdfDocument.Close();
}
catch (Exception ex)
{
Console.WriteLine("An error occurred: " + ex.Message);
}
我想尝试的代码是
@Kamran 您有在 .net6 应用程序中使用 iText.Pdfocr 的解决方案吗?我有同样的问题,但没有找到任何解决方案。