我想在图像或pdf文件中逐行提取文本图像,我使用了许多其他方法,但似乎不起作用。我想找到一个最佳解决方案。
我已经使用了许多软件包,例如 PyMuPDF、pdfplumber,并且 PyMuPDF 到目前为止运行良好。但对于图像我还没有开始,因为我不知道从哪里开始。
你可以关注这个视频(它对我有用)。 https://www.youtube.com/watch?v=nnZRBAzW3CA
有一个名为“aspose-pdf”的包,我们可以使用 python 从 pdf 中裁剪图像。它只需要您需要裁剪的区域的宽度和高度作为参数。