ocr 相关问题

光学字符识别，通常缩写为OCR，是将手写，打字或打印文本的扫描图像机械或电子转换为机器编码文本。

使用 python-tesseract 获取识别单词的边界框

我正在使用 python-tesseract 从图像中提取单词。这是 tesseract 的 python 包装器，它是一个 OCR 代码。我使用以下代码来获取单词：导入超正方体 API =

python image-processing ocr tesseract python-tesseract

回答 9 投票 0

如何从裁剪图像中 OCR 蓝色背景上带有白色字符的文本？

首先，我想使用鼠标事件裁剪图像，然后打印裁剪图像内的文本。我尝试了 OCR 脚本，但所有这些脚本都不适用于下面所附的图像。我认为原因是...

python opencv ocr python-tesseract

回答 2 投票 0

使用 Keras OCR 返回字符串

我正在使用 Keras OCR 的示例来检测图像中的文本。使用官方文档中提供的示例代码，我使用预训练的权重获得了很好的准确性。我打算使用...

python keras ocr

回答 2 投票 0

类型错误：'<' not supported between instances of 'tuple' and 'float'

从PIL导入Image、ImageDraw、ImageFont 图像 = Image.open(img_path).convert('RGB') box = [结果中的行[0]] txts = [结果中的行[1][0]

python machine-learning ocr paddle-paddle paddleocr

回答 1 投票 0

导入错误：无法从“layoutlm

我正在尝试保存 LayoutLM 模型的预测。论文 - https://arxiv.org/abs/1912.13318 笔记本 - https://www.kaggle.com/code/iamarjunchandra/layoutlm-document-sequence-labeling-model/

python machine-learning pdf nlp ocr

回答 1 投票 0

在 pytesseract 中检索到错误的数字

我正在尝试使用 pytesseract 从在线图像中检索数据，但是结果非常糟糕，我想知道是否有办法改进它。这是我的代码：导入io 导入请求 ...

python ocr tesseract python-tesseract image-preprocessing

回答 1 投票 0

使用 Tesseract 无法识别图像中的单个字符

我尝试从附图中提取号码 [ 但我没有得到数字 8 作为输出。我也尝试过使用不同的 PSM 值，例如 6、10 等。这是我到目前为止所拥有的：图片=...

python-3.x ocr tesseract python-tesseract text-extraction

回答 1 投票 0

使用 Tesseract 界面进行 OCR

如何在 C# 中使用 Tesseract 的界面 OCR tiff 文件？目前我只知道如何使用可执行文件来做到这一点。

c# ocr tesseract

回答 5 投票 0

寻求 ML 模型建议以增强损坏文本图像的 OCR 功能

我正在开展一个项目，需要对基于文本的图像执行光学字符识别（OCR）。然而，这些图像以各种方式被损坏（例如模糊、扭曲、低分辨率......

python tensorflow opencv pytorch ocr

回答 2 投票 0

如何训练 Tesseract 5 以识别旧扫描书籍中的阿姆哈拉语文本

背景我正在尝试在用阿姆哈拉语（使用埃塞俄比亚文字）编写的扫描旧书上使用 tesseract 5.3.3。 tesseract 的 amh.traineddata 的主要缺点埃塞俄比亚语类型的差异

ocr tesseract text2image tesseract-5.x tesstrain

回答 1 投票 0

我们是否能够使用bus64或图像链接将OCR与Microsoft Power Automate集成？

我们希望人们在 Microsoft Power Automate 中进行 OCR，这确实发生了，但我们希望以动态的方式呈现这一点。我们用它来识别图像或 PDF 文档中的文本，并且工作正常......

ms-access ocr power-automate microsoft-copilot

回答 1 投票 0

从带图纸的专利中提取可编辑文本

我有一堆专利的扫描图像，我需要以某种方式将其转换为某种可编辑的形式（最好是 docx）。以下是一页的示例：我使用 tesseract 成功提取了文本...

conv-neural-network ocr tesseract yolo

回答 1 投票 0

如何在 OCR 中反转地图的色调？

我有一张部分美国地图，有不同深浅的蓝色。我正在研究如何：计算并对应地图中不同深浅的蓝色（例如，1 为最浅的蓝色，10 为最暗（如果有的话）...

python r colors ocr

回答 1 投票 0

使用python从pdf中检测语言/脚本

我正在尝试创建一个python脚本来在pytesseract的帮助下检测尚未OCRed pdf中的语言/脚本，然后通过传递正确的检测到的语言来进行“真正的”ocr...

ocr python-tesseract

回答 1 投票 0

R/Python：将 PDF 转换为表格

我的计算机上保存有一个 PDF 图像文件（例如“p1.pdf” - 这是原始文档的扫描副本） - 该文件看起来像这样（我添加了红线以显示

python r ocr tesseract data-manipulation

回答 2 投票 0

MediaProjection 的 CPU 使用率过高，留给 OCR 的 CPU 使用率却很低？

我在Android上使用两种不同的方法截取屏幕截图：通过运行 /system/bin/screencap -p $path。使用 MediaProjection API。即使是完全相同的屏幕，执行 OCR 时...

java android ocr cpu-usage android-mediaprojection

回答 1 投票 0

Tesseract.js OCR 如何正确设置页面分割模式（PSM、pageseg）以检测图像中的单个数字

我一直在使用tesseract读取各种数字（最多99,999.9），格式如下： OCR 失败的图像示例：似乎 80% 的时间都能正确读取，但我需要 95% 的时间...

javascript ocr tesseract python-tesseract tesseract.js

回答 1 投票 0

如何从图像中提取文本数据并将其构建到 Excel 表格中

我正在提取 JSON 数据，它提供以下结果。该数据包括从图片中检索到的文本的坐标。有没有办法识别表格并将数据存储在 Excel 中...

python excel coordinates ocr

回答 1 投票 0

有没有任何OCR或技术可以识别/识别以pdf文档形式打印的单选按钮？

我有一个 pdf 文档，其中包含无线电响应（如所附屏幕截图）。我只想通过 python 或任何 OCR 技术提取所选响应。有什么办法可以做到吗？（https://i.stack。

python nlp ocr large-language-model information-extraction

回答 1 投票 0

使用 OCR Mobile Vision 从身份证中提取姓名

我可以使用 Mobile Vision API 文本识别从身份证中获取所有文本，但我想从文本中提取特定信息，例如姓名。一个输出块是这样的：是...

java android google-api ocr text-recognition

回答 2 投票 0

ocr 相关问题

最新问题