Tesseract OCR 错误结果

Question

我有这样的图片当尝试使用 C# TesseractOCR 读取它们时，我有时会得到结果 38845283-05，这是不正确的，因为开头的“3”不应该在那里。这是直接来自 Tesseract 结果的 page.ThresholdedImage 图像：即使我将此图像传递给 Tesseract，我也会得到相同的错误 38845283-05 结果。

或者这样：即使我将 ROI 区域设置得非常靠近字符，我也得到 13.11.238。

好像 3 或 8 被识别了两次。

我尝试过不同的EngineModes、不同的PageSegModes，但我还没有找到可靠的设置。

你有什么建议吗？（培训除外:)）谢谢你。

即使在 tesseract.projectnaptha.com 上，结果也是错误的：

Answer 1

tesseract 对你的图像没有问题：

tesseract WOsO1.png -
8845283-05

tesseract hTTcW.png -
13.11.23

IMO，你应该检查你的代码，确保使用最新版本，正确的语言数据等......

Tesseract OCR 错误结果

问题描述投票：0回答：1

1个回答

最新问题

Tesseract OCR 错误结果

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1