如何读取旋转的文字?

问题描述 投票:0回答:1

给我这个结果

"AI(240)10575323190069
AI(13)240215
24-02-15 (YY-MM-DD)
PI-734875-1
19006
© Inter IKEA Systems
B.V. 2021
105.753.23
Made in Pakistan"

只是错过了

"2407"
写在pdf的大多数右侧,如下所示。有什么方法可以从我的pdf中读取它?
我希望与所有内容一起阅读文档右侧的旋转文本。
这是我的pdf文件的内容:

ORC通常是有问题的,尤其是对于数字而言,因此,如果您有95%正确的情况,那是好的,然后您只需要更正最后5%。 avoid ocr的数字通常会丢失或不正确,并且在其他文本的页面中通常不会识别大

105.753.23

在这里,我使用了Sautinsoft的在线演示,可以获得2407,但对于其他所有图像,可能并非如此。 OCR永远不会“保证”,也不应该是。

c# pdf itext
1个回答
0
投票

您只需要求Tesseract在此处同时生成文本和PDF即可获得相同的(或更好的质量)。

再次注意,

105.753.23

19006

都被误读为maaatt.

enter image description here

© www.soinside.com 2019 - 2024. All rights reserved.