ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

itext7 与 .net core 应用程序中的 pdfocr。兼容性问题

我需要在.net core 6应用程序中读取PDF图像。我正在尝试使用 itext7 和 pdfocr 但我收到错误 严重性代码 说明 项目文件行抑制状态 警告 N...

回答 1 投票 0

Pytesseract OCR 将“o”识别为“0”

我正在尝试使用 pytesseract 库读取此图像上的文本。 原始截图.png 这是我的代码: 路径='原始屏幕截图.png' 图像 = cv2.imread(路径) 图像 = cv2.cvtColor(图像, cv2.

回答 1 投票 0

准确检测图像中随机旋转的文本

我正在尝试检测项目中的文本,这些项目可能会向各个方向旋转。我尝试过使用 Tesseract、EasyOCR 和 EAST 进行文本检测和提取,但遇到了问题

回答 1 投票 0

检测OCR文本图像是否上下颠倒

我有数百张图像(扫描文档),其中大多数都是倾斜的。我想使用 Python 来消除它们的偏差。 这是我使用的代码: 将 numpy 导入为 np 导入CV2 来自 skimage.transform

回答 4 投票 0

从图像中删除(裁剪)文本

我正在尝试实现一个图像识别程序,我需要删除(或“裁剪”)图像上存在的所有文本,例如: 对此: 我已经尝试过 Keras OCR m...

回答 2 投票 0

粗体文本检测

我目前正在开发一个项目,我需要检测多字体大小图像上的粗体文本(因此不可能使用数学形态学)。该检测将与 OCR 系统并行使用(带有

回答 1 投票 0

是否可以通过PaddleOCR获取文本区域的旋转角度?

PaddleOCR 在 use_angle_cls=True 模式下可以正确识别 90 度、180 度甚至 270 度旋转文本,但它在结果中不提供任何有关旋转角度的信息。因此,...

回答 1 投票 0

如何判断图像中的文字是否上下颠倒?

我需要确定图像上的文字是否颠倒。我的图像示例: 1 2 3 4 5 我通过比较原始图像和 180 度旋转图像的置信度分数来做到这一点,但有时......

回答 1 投票 0

使用

我想从这张图片中的表中提取数据,我使用 cv2 和 pytesseract 但我没有得到可靠的结果。这是我的代码和我的图像。 在此输入图像描述 导入CV2 导入 pytess...

回答 1 投票 0

Python 立即在屏幕上查找数字

我有一个包含 75 张黑白图像的文件夹,所有图像都包含 1-75 的数字。我想做的是,当这些数字之一出现在我的屏幕上时,我想打印它的数字......

回答 2 投票 0

Datacap 是否有办法读取可搜索的 pdf 而不是使用 OCR?

我正在使用可搜索的 pdf,无需 OCR 文档。 Datacap 中是否有可以读取数据而不是使用 OCR 的规则/操作?

回答 1 投票 0

使用node javascript:如何使用OpenAI api作为本地图像的OCR?

我尝试使用openApi的api作为本地图像中gpt-4o模型的节点中的OCR。 const api_key = “mykey” 从“openai”导入 OpenAI; 从“fs”导入 fs const openai = 新 Ope...

回答 0 投票 0

Pytesseract 对于实时 OCR 来说非常慢,有什么方法可以优化我的代码吗?

我正在尝试使用 mss 和 pytesseract 在 python 中创建实时 OCR。 到目前为止,我已经能够捕获 FPS 稳定为 30 的整个屏幕。如果我想捕获较小的区域...

回答 4 投票 0

将图像从反应本机转换为多部分表单数据

我想将图像从 React Native 转换为多部分/表单数据格式, 类似于 ReactJS 中的图像数据:, 要与此 API 一起使用:https://rapidapi.com/iq.faceok/api/ocr-extract-text/playground/

回答 1 投票 0

如何使用 PyTesseract 读取给定图像上的小数字

我正在尝试使用 OpenCV 和 Pytesseract 循环遍历该图像(或类似图像)底部的白色数字并记录每个数字。 虽然我有正确的逻辑来确定...

回答 1 投票 0

识别一种类型文档的不同模板

如果我在这里问了错误的问题,我提前道歉。但不要严格判断,只要告诉我去哪里或提供信息链接即可。 我的问题的本质如下:我有

回答 1 投票 0

如何用PHP从截图中抓取字幕?

我从电影截图中抓取字幕。 一个例子 它会抢 嘿,我们为什么不放松一下呢? 与字幕无关。是截图。因为它是字幕,所以我们知道字体

回答 1 投票 0

改进 OCR/图像识别的预处理

目前我对图像处理和光学字符识别非常感兴趣。经过一些基本的认识和一些过滤后,我决定开始一些更困难的事情。 我正在努力

回答 1 投票 0

Python tesseract OCR 检测文本不正确

testimg.png: 我试图检测该图像中的文本,但它没有给我任何信息,它几乎适用于其他一些文本。它给了我一些用随机字母替换的单词,我必须比较......

回答 1 投票 0

azure sdk 中不断出现读取失败的错误

我正在尝试自动化一些功能,它涉及利用 azure 图像分析 API 和 pyautogui 根据 OCR 中的坐标单击特定文本。 以下是我的代码: 我...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.