我有这样的图片 当尝试使用 C# TesseractOCR 读取它们时,我有时会得到结果 38845283-05,这是不正确的,因为开头的“3”不应该在那里。 这是直接来自 Tesseract 结果的 page.ThresholdedImage 图像: 即使我将此图像传递给 Tesseract,我也会得到相同的错误 38845283-05 结果。
或者这样:即使我将 ROI 区域设置得非常靠近字符,我也得到 13.11.238。
好像 3 或 8 被识别了两次。
我尝试过不同的EngineModes、不同的PageSegModes,但我还没有找到可靠的设置。
你有什么建议吗? (培训除外:)) 谢谢你。
tesseract 对你的图像没有问题:
tesseract WOsO1.png -
8845283-05
tesseract hTTcW.png -
13.11.23
IMO,你应该检查你的代码,确保使用最新版本,正确的语言数据等......