ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

Paddle OCR 检测置信度

我有一个关于 Paddle OCR 检测模型的问题。 Paddle OCR 输出结果是边界框的坐标、识别的文本和置信度分数,来自我的研究

回答 1 投票 0

计算用于 OCR 评估的字符混淆矩阵?

我正在处理 OCR 任务,出于评估目的,想要计算我的模型的混淆矩阵。我希望它基本上显示一个角色被正确预测的频率以及它的频率

回答 1 投票 0

字符串操作 - 是否可以从 Google Cloud Vision OCR 中删除输出文本中不可预测的额外空格?

目前存在不可预测的额外空格,如下两个样本(OCR结果);而Google此时还没有完全修复它;因此,我们正在寻找后期处理(Do String Manipulat...

回答 1 投票 0

我如何从头开始创建模型以从扫描的发票中提取文本和表格数据

所以我目前正在进行一个项目,我们收到了 25 种不同的发票类型,全部都是扫描的。最终目标是从发票中提取文本和表格数据,然后最终解析...

回答 1 投票 0

去除图像中的噪声,以便使用 OCR 处理文本

我需要处理一系列图像,然后使用OCR对其进行处理以获得这些图像中出现的文本。 彩色图像中的文本不够清晰,OCR 无法清楚地识别...

回答 1 投票 0

如何检测自然文本图像中的字符?

我有一个关于字符识别的项目(使用openCV库)。 我不知道如何检测文本图像中的字符。 你能推荐一些方法来做到这一点吗? 谢谢大家!

回答 1 投票 0

与文档智能 - Azure 认知服务相关

我在文档智能工作室(以前称为表单识别器)中构建了一个组合模型。它旨在从具有不同模式的不同类型文档中提取不同字段。 T...

回答 1 投票 0

OCR.space 错误 99

我在我的网站上使用免费的 OCR.space api,并使用 base64Image 上传图像(从 html 文件中输入的仅 jpg 文件接收),并收到此错误: {“OCRExitCode&qu...

回答 1 投票 0

从图片中读取文本

我有一个图像,出于纯粹的好奇目的,我想阅读它,我还想自学如何阅读如此复杂的图像以供以后分析等。 一开始我尝试申请

回答 1 投票 0

如何在 Windows 上训练 Tesseract

我正在尝试训练 tesseract 在 Windows 上的工作。这个过程完成得很好,但是当我打电话给 tesseract.exe file.tiff 输出 运行后,文件为空。 我不知道发生了什么

回答 3 投票 0

需要分别从图像中分割每个数字

我使用 MNIST 数据集创建了一个 CNN 模型。我想对图像中存在的数字序列进行预测。该技术涉及分割每个图像并将其输入到

回答 1 投票 0

当单词彼此靠近时,Pytesseract 错误的文本识别

当我使用 PyTesseract 识别该图像中的文本时,它返回“FORREST C.BLopGetTrT”而不是 FORREST C.BLODGETT 我得到的代码结果 我使用的图像,其中包含许多名称。 我是...

回答 1 投票 0

VNRecognizeTextRequest 失败,但可以在 Preview.app 中选择文本

我在 OCR 服务器中使用 VNRecognizeTextRequest,该服务器通过 TCP 接受图像、执行 OCR 并返回提取的文本。目标是支持所有语言,但存在中文问题。 哦...

回答 1 投票 0

.net 中有免费的 LPR(车牌识别器)软件吗? [已关闭]

.net 中有免费软件 LPR(车牌识别器)库或软件吗? 您还可以列出 .net 中可用的免费软件 OCR 库和软件吗?

回答 1 投票 0

读取pdf文件并提取值作为键值对python

我有一个pdf格式,我通过OCR阅读并使用不同的库来提取内容。 然而,提取的数据并没有给我一个键值对。 我需要值对来映射数据精度...

回答 1 投票 0

在iOS上从图像中解析众所周知格式的字符串的方法是什么(专门为此目的创建的一些库)?

俄罗斯圣彼得堡的当地旅行卡有大量的 ID 号码,在线充值卡时不容易读取和输入到网页中。所以我想构建一个小应用程序......

回答 2 投票 0

优化 iPhone 上的“绘图”应用程序,以便用户绘图时屏幕不会移动

我正在使用 myscript 中的 API 进行字符识别 https://myscript.github.io/MyScriptJS/examples/v4/websocket_text_iink_no_smartguide.html 我正在创建一个要通过

回答 1 投票 0

通过 LLMWhisperer python API 处理 OCR 请求输出的策略

我正在尝试使用LLMWhisperer对外语文档进行OCR。该语言使用特殊字符,但可以使用 UTF-8 完全表达。通过“游乐场”使用 LLMWhisperer ...

回答 1 投票 0

Power Automate Desktop 中的正则表达式/设置文本解析

我正在使用从 Power Automate Desktop 中的收据内容 OCR 中提取的列表,并希望筛选特定的数字组(价格)。问题是 00-00 日期格式的数字会保留

回答 1 投票 0

Document AI 自定义处理器 - 跨页面注释

我目前正在使用 Google 的文档 AI 构建自定义 OCR 提取器,我的文档通常约为 8-14 页长,并且我已经在所有可能的页面上创建了一个架构。使用定义的 sc...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.