python-tesseract 相关问题

Python-tesseract是Tesseract OCR的包装类,允许读取任何传统图像文件(JPG,GIF,PNG,TIFF等)并将其解码为可用文本。

使用tesseract从PDF中提取正确数据的问题

我正在尝试从多个 PDF 中提取特定数据。我首先使用水平线和垂直线隔离示例图像(图 1)来创建单元格。创建单元格后,我裁剪它们

回答 1 投票 0

使用 pytesseract OCR 从验证码中读取文本

我需要使用Pytesseract从这张图片中提取文本: 我正在使用这段代码: 导入 pytesseract 导入CV2 pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR esser...

回答 1 投票 0

在 Digital Ocean 应用程序中使用 Poppler 和 Django

我在 Poppler 与 DigitalOcean 应用程序的配合上遇到问题。 我有一个已构建的 Django Web 应用程序,并且有一个要运行的自动化脚本。 该脚本采用文本文件

回答 1 投票 0

在 pytesseract 中使用 image_to_osd 方法时出现错误

这是我的代码: 导入 pytesseract 导入CV2 从 PIL 导入图像 pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files (x86)\Tesseract-OCR esseract.exe" def main(): 原始 = cv2.i...

回答 4 投票 0

Tesseract OSD 无法在 /tmp 中找到文件

所以我试图用 Tesseract 的 image_to_osd() 来获取表格图像的方向。完整代码在这里: 导入CV2 从 PIL 导入图像 导入 pytesseract 从 skimage 导入 io 来自 skimage.transf...

回答 1 投票 0

有谁知道pytesseract的image_to_data和image_to_osd方法的输出的含义吗?

我正在尝试使用 pytesseract 从图像中提取数据。该模块有 image_to_data 和 image_to_osd 方法。这两个方法提供了大量信息(TextLineOrder、WritingDirection、

回答 2 投票 0

从 pdf 中提取非结构化发票数据

我正在尝试提取PDF数据,这是非常非结构化的。使用这些包(pdf2image、pytesseract、pillow、matplotlib)来获取此输出。 “我被困在这里试图提取......

回答 1 投票 0

为什么我在尝试使用 pytesseract 时遇到错误?

导入pytesseract 导入PIL 从 PIL 导入图像 pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR esseract.exe' 我单独尝试使用该代码以及许多其他方式来输入...

回答 2 投票 0

pytesseract 无法从图像中提取文本

我有以下图像并尝试使用 pytesseract 提取文本。但是,它总是返回一些未知的字符。 图像 这是我正在使用的代码: 将 pytesseract 导入为 pt 来自 PIL

回答 1 投票 0

如何使用 Tesseract 识别图像中的单个字符?

这是原图: 这是处理后的图像: 我正在尝试自动化一个迷你游戏,其中角色出现在屏幕上。我做了一些简单的研究并设法处理图像......

回答 1 投票 0

在 Windows 上实现“实时屏幕捕获”文本检测/提取

嗨,实现从电脑屏幕本身(可能是屏幕的一部分)的“实时馈送或捕获”检测文本的最佳方法是什么,以便程序可以基于什么执行...

回答 1 投票 0

找不到“pytesseract”模块

我正在使用 Visual Studio 代码,并在 Ubuntu 上安装了 Python 扩展,我创建了一个名为“image_extraction”的 Python 文件并安装了 selenium、fuzzy-wuzzy 和其他模块。

回答 0 投票 0

如何使用 Pytesseract 改进 Python 中图像的文本提取?

我想开展一个小型个人项目,其中包括从图像中提取文本并将其翻译成其他语言,全部使用 python。但是当我想提取文本时遇到问题

回答 1 投票 0

使用 pytesseract 从矩阵图像中获取数字

我正在尝试从 4x4 矩阵图像中检索文本。文字是数字。尽管我期待着数字,但我得到的只是:BE、8、EEE、BE。图片附在这里:图片 任何人

回答 1 投票 0

Pytesseract OCR 将“o”识别为“0”

我正在尝试使用 pytesseract 库读取此图像上的文本。 原始截图.png 这是我的代码: 路径='原始屏幕截图.png' 图像 = cv2.imread(路径) 图像 = cv2.cvtColor(图像, cv2.

回答 1 投票 0

使用

我想从这张图片中的表中提取数据,我使用 cv2 和 pytesseract 但我没有得到可靠的结果。这是我的代码和我的图像。 在此输入图像描述 导入CV2 导入 pytess...

回答 1 投票 0

如何在 Windows 上安装 Tesseract 的新语言包

我已经在我的 venv 中安装了 pytesseract 模块,并且想要从德语图像中提取文本。 要么执行这个脚本 pytesseract 并将语言设置为德语 导入CV2 导入

回答 4 投票 0

使用pyautogui在后台控制应用程序

免责声明-我是编码新手,不久前才开始学习,所以不要因为代码而评判我,谢谢。 我为我的游戏制作了一个机器人来执行一些特定任务,但问题是它使用 pyauto...

回答 2 投票 0

Pytesseract 对于实时 OCR 来说非常慢,有什么方法可以优化我的代码吗?

我正在尝试使用 mss 和 pytesseract 在 python 中创建实时 OCR。 到目前为止,我已经能够捕获 FPS 稳定为 30 的整个屏幕。如果我想捕获较小的区域...

回答 4 投票 0

无法使用pytesseract正确解决验证码

我创建了一个Python代码来使用OCR读取验证码并进一步填写表格。我使用 pytesseract 库来识别验证码中的字符。我无法检索 c...

回答 1 投票 0

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.