ocr 相关问题

光学字符识别，通常缩写为OCR，是将手写，打字或打印文本的扫描图像机械或电子转换为机器编码文本。

从发票中提取 pdf 或图像格式的数据

我正在开发发票解析器，它从 pdf 或图像格式的发票中提取数据。它适用于具有非表格数据的简单 pdf，但提供大量输出数据以使用包含

parsing ocr invoice pdftotext tabula

回答 2 投票 0

Python 图像到数字避免 OCR [已关闭]

我有以下问题。一系列图像一出现就应分配给数字。我多次尝试对图像进行 OCR，但都失败了。有更简单的解决方案吗？如果我采取

python image preprocessor ocr

回答 1 投票 0

Python 中的 OCR 图像预处理

我正在用Python对OCR图像进行预处理。我将 pdf 转换为二进制图像。我得到的输出是这样的我希望输出是这样的知道该怎么做吗？

python image-processing ocr

回答 1 投票 0

如何使用 Microsoft Azure 计算机视觉 AI 提高图像中文本读取的准确性

我是 Microsoft Azure AI 计算机视觉的新手。我在 Python 程序中使用认知服务和计算机视觉客户端来做两件事：使用光学字符从 JPG 图像中提取文本...

python azure ocr azure-cognitive-services

回答 1 投票 0

在tesserocr中，当我使用oem和psm选项初始化api来运行DetectOS时，它会引发错误（致命Python错误：中止）。为什么？

问题：在 tesserocr 中，当我使用 oem 和 psm 选项初始化 api 来运行 DetectOS 或 DetectOrientationScript 时，它会引发错误（致命 Python 错误：中止）。为什么会发生这样的事？代码：来自 tesserocr

python-3.x ocr lstm tesseract

回答 1 投票 0

如何训练 Tesseract 识别点分零？

问题如何训练 Tesseract OCR 将 0 识别为零，或提示零是虚线的？它通常被认为是 6/8/9，但其实际为零的置信度为 0%。我在这里...

c# ocr tesseract

回答 2 投票 0

如何以编程方式启动 Google 自动填充的“扫描新卡”意图

我想从我的 Android 应用程序启动“扫描新卡”活动。此功能由 Google 提供，用于扫描并填写 EditText 内的信用卡/借记卡号，并且我...

android google-play-services ocr autofill credit-card

回答 1 投票 0

如何正确识别90度和270度旋转的文字？

我需要对包含普通水平文本的图像执行 OCR 任务，除此之外，还需要对 90 度和 270 度旋转的文本进行 OCR 任务，如下所示我使用 python 和 PaddleOcr .PaddleOCR 可以识别旋转的 te...

ocr image-rotation paddleocr

回答 1 投票 0

尝试将 PDF 转换为 JPEG，但我始终遇到错误

我正在尝试使用 python 将 PDF 转换为 JPEG。我试图通过将 PDF 转换为 JPEG 来执行 OCR，但不断遇到错误：无法识别图像文件<_io.BytesIO object...

python io ocr python-tesseract pdf2image

回答 1 投票 0

OCR：使用 Tesseract 从平面图中提取房间名称（包含图像）

我正在就使用 Tesseract 从平面图图像中提取房间名称的项目寻求一些友好的建议。我非常有信心我的后期处理是正确的，但我陷入了棘手的困境......

python-imaging-library ocr tesseract python-tesseract image-preprocessing

回答 1 投票 0

如何使用tess4j提取图像中的文本坐标

我试图弄清楚在tess4j执行OCR后如何获取文本图像中的坐标和单词矩形。我是初学者，有人可以帮我分解一下吗？非常感谢。

image-processing ocr tesseract

回答 2 投票 0

在 Windows 10 上安装适用于 C++ 的 tesseract

我在 Windows 10 上安装 tesseract 以使用 C++ 进行开发时遇到问题。任何人都可以提供指南来获取： 1. Leptonica（tesseract 所需）lib 并包含 2. Tesseract lib 并包含...

c++ installation ocr tesseract

回答 5 投票 0

OCR 文件夹中的每个 .png 文件

我想迭代文件夹中的每个 .png 文件并打印图像中包含的每个文本。第一次迭代工作正常，但第二次迭代出现错误。代码：导入 pytesseract 来自 PIL

python ocr

回答 3 投票 0

使用 Tesseract OCR 识别浮雕文本的最佳方法是什么？

我正在尝试读取一美分硬币上的文字来确定硬币的方向。原文来自 https://www.usmint.gov/wordpress/wp-content/uploads/2024/05/2024-lincoln-penny-uncirculated-obverse-philadelp...

python ocr tesseract python-tesseract image-preprocessing

回答 1 投票 0

使用tesseract从PDF中提取正确数据的问题

我正在尝试从多个 PDF 中提取特定数据。我首先使用水平线和垂直线隔离示例图像（图 1）来创建单元格。创建单元格后，我裁剪它们

extract ocr tesseract python-tesseract

回答 1 投票 0

如何在Mindee docTR中保留文档结构

我使用 docTR 从 pdf 中提取文本，然后将数据放入数据库中。例如，如果 pdf 是这样的：图像 docTR 需要保留相同的结构，以便我可以轻松提取数据...

python java regex ocr

回答 1 投票 0

使用 pytesseract OCR 从验证码中读取文本

我需要使用Pytesseract从这张图片中提取文本：我正在使用这段代码：导入 pytesseract 导入CV2 pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR esser...

python ocr tesseract captcha python-tesseract

回答 1 投票 0

我们可以训练谷歌视觉 OCR 来读取打印的复杂数学表达式吗？

Google Vision OCR API 无法读取数学表达式，我们可以训练它读取复杂的数学表达式吗？如果是，请告诉我们程序。如果没有，请您建议...

math ocr mathematical-expressions google-vision

回答 1 投票 0

在 pytesseract 中使用 image_to_osd 方法时出现错误

这是我的代码：导入 pytesseract 导入CV2 从 PIL 导入图像 pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files (x86)\Tesseract-OCR esseract.exe" def main(): 原始 = cv2.i...

python-3.x ocr tesseract python-tesseract pytesser

回答 4 投票 0

Tesseract OSD 无法在 /tmp 中找到文件

所以我试图用 Tesseract 的 image_to_osd() 来获取表格图像的方向。完整代码在这里：导入CV2 从 PIL 导入图像导入 pytesseract 从 skimage 导入 io 来自 skimage.transf...

ocr tesseract python-tesseract

回答 1 投票 0

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.