我需要裁剪图像以仅获取页脚信息。有了这些信息,我得到了找到的文本的位置(使用pytesseract),但是只有页脚图像。因此,当我处理完整图像时,需要更新位置。现在这是我所拥有的:
裁剪图像:
from wand.image import Image as Img
from wand.color import Color
with Img(filename=img, resolution=300) as pic:
pic.compression_quality = 100
pic.background_color = Color("white")
pic.alpha_channel = 'remove'
heightRatio = int(pic.height / 3 + pic.height * 0.1)
pic.crop(0, int(pic.height - heightRatio), pic.width, pic.height)
pic.save(filename=jpgName)
[之后,我的文字位置为{0: {x1,y1}, 1: {x2,y2}}
,并且我有以下代码尝试获取未裁剪图像的位置:
position[0][0] = line.position[0][0]
position[1][0] = line.position[1][0]
position[0][1] = line.position[0][1] + heightRatio
position[1][1] = line.position[1][1] + heightRatio
但是当我在完整图像上显示位置时,它根本不适合。
任何想法?
提前感谢
我终于找到了答案:裁剪功能是问题。使用此参数更好:
pic.crop(width = pic.width,height = int(pic.height-self.heightRatio),gravity ='south')