ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

从发票中提取 pdf 或图像格式的数据

我正在开发发票解析器,它从 pdf 或图像格式的发票中提取数据。它适用于具有非表格数据的简单 pdf,但提供大量输出数据以使用包含

回答 2 投票 0

Python 图像到数字避免 OCR [已关闭]

我有以下问题。一系列图像一出现就应分配给数字。我多次尝试对图像进行 OCR,但都失败了。有更简单的解决方案吗?如果我采取

回答 1 投票 0

Python 中的 OCR 图像预处理

我正在用Python对OCR图像进行预处理。我将 pdf 转换为二进制图像。我得到的输出是这样的 我希望输出是这样的 知道该怎么做吗?

回答 1 投票 0

如何使用 Microsoft Azure 计算机视觉 AI 提高图像中文本读取的准确性

我是 Microsoft Azure AI 计算机视觉的新手。我在 Python 程序中使用认知服务和计算机视觉客户端来做两件事: 使用光学字符从 JPG 图像中提取文本...

回答 1 投票 0

在tesserocr中,当我使用oem和psm选项初始化api来运行DetectOS时,它会引发错误(致命Python错误:中止)。为什么?

问题: 在 tesserocr 中,当我使用 oem 和 psm 选项初始化 api 来运行 DetectOS 或 DetectOrientationScript 时,它会引发错误(致命 Python 错误:中止)。为什么会发生这样的事?代码: 来自 tesserocr

回答 1 投票 0

如何训练 Tesseract 识别点分零?

问题 如何训练 Tesseract OCR 将 0 识别为零,或提示零是虚线的?它通常被认为是 6/8/9,但其实际为零的置信度为 0%。 我在这里...

回答 2 投票 0

如何以编程方式启动 Google 自动填充的“扫描新卡”意图

我想从我的 Android 应用程序启动“扫描新卡”活动。 此功能由 Google 提供,用于扫描并填写 EditText 内的信用卡/借记卡号,并且我...

回答 1 投票 0

如何正确识别90度和270度旋转的文字?

我需要对包含普通水平文本的图像执行 OCR 任务,除此之外,还需要对 90 度和 270 度旋转的文本进行 OCR 任务,如下所示 我使用 python 和 PaddleOcr .PaddleOCR 可以识别旋转的 te...

回答 1 投票 0

尝试将 PDF 转换为 JPEG,但我始终遇到错误

我正在尝试使用 python 将 PDF 转换为 JPEG。我试图通过将 PDF 转换为 JPEG 来执行 OCR,但不断遇到错误: 无法识别图像文件<_io.BytesIO object...

回答 1 投票 0

OCR:使用 Tesseract 从平面图中提取房间名称(包含图像)

我正在就使用 Tesseract 从平面图图像中提取房间名称的项目寻求一些友好的建议。我非常有信心我的后期处理是正确的,但我陷入了棘手的困境......

回答 1 投票 0

如何使用tess4j提取图像中的文本坐标

我试图弄清楚在tess4j执行OCR后如何获取文本图像中的坐标和单词矩形。我是初学者,有人可以帮我分解一下吗?非常感谢。

回答 2 投票 0

在 Windows 10 上安装适用于 C++ 的 tesseract

我在 Windows 10 上安装 tesseract 以使用 C++ 进行开发时遇到问题。 任何人都可以提供指南来获取: 1. Leptonica(tesseract 所需)lib 并包含 2. Tesseract lib 并包含...

回答 5 投票 0

OCR 文件夹中的每个 .png 文件

我想迭代文件夹中的每个 .png 文件并打印图像中包含的每个文本。第一次迭代工作正常,但第二次迭代出现错误。 代码: 导入 pytesseract 来自 PIL

回答 3 投票 0

使用 Tesseract OCR 识别浮雕文本的最佳方法是什么?

我正在尝试读取一美分硬币上的文字来确定硬币的方向。 原文来自 https://www.usmint.gov/wordpress/wp-content/uploads/2024/05/2024-lincoln-penny-uncirculated-obverse-philadelp...

回答 1 投票 0

使用tesseract从PDF中提取正确数据的问题

我正在尝试从多个 PDF 中提取特定数据。我首先使用水平线和垂直线隔离示例图像(图 1)来创建单元格。创建单元格后,我裁剪它们

回答 1 投票 0

如何在Mindee docTR中保留文档结构

我使用 docTR 从 pdf 中提取文本,然后将数据放入数据库中。例如,如果 pdf 是这样的: 图像 docTR 需要保留相同的结构,以便我可以轻松提取数据...

回答 1 投票 0

使用 pytesseract OCR 从验证码中读取文本

我需要使用Pytesseract从这张图片中提取文本: 我正在使用这段代码: 导入 pytesseract 导入CV2 pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR esser...

回答 1 投票 0

我们可以训练谷歌视觉 OCR 来读取打印的复杂数学表达式吗?

Google Vision OCR API 无法读取数学表达式,我们可以训练它读取复杂的数学表达式吗?如果是,请告诉我们程序。如果没有,请您建议...

回答 1 投票 0

在 pytesseract 中使用 image_to_osd 方法时出现错误

这是我的代码: 导入 pytesseract 导入CV2 从 PIL 导入图像 pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files (x86)\Tesseract-OCR esseract.exe" def main(): 原始 = cv2.i...

回答 4 投票 0

Tesseract OSD 无法在 /tmp 中找到文件

所以我试图用 Tesseract 的 image_to_osd() 来获取表格图像的方向。完整代码在这里: 导入CV2 从 PIL 导入图像 导入 pytesseract 从 skimage 导入 io 来自 skimage.transf...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.