ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

如何创建一个简单的网站,使用 Google Vertext AI Vision API 将用户提交的图像转换为文本

我正在尝试构建一个简单的 html/css/jquery 网站,该网站使用 Google Vertext AI Vision API(或其他服务)将用户提交的图像转换为文本。 如果有人能回答我,我将不胜感激

回答 1 投票 0

如何从 PDF/扫描 PDF 中的图像中提取表格?

工作是从扫描的PDF中提取表格。我尝试使用 Camelot/tabula,但没有任何效果。 关于如何提取表格有什么建议吗? 例子 Camelot/tabula 没有一个检测到...

回答 1 投票 0

在 Windows Python 中将不可搜索的 Pdf 转换为可搜索的 Pdf

需要一个解决方案将每个页面都是图像且页面可以包含文本、表格或两者的组合的 PDF 文件转换为可搜索的 pdf。 我使用过 ABBY FineReader Online,它是...

回答 4 投票 0

另存为 PDF 并保留文本

我一整天都在尝试解决这个简单的问题,但我一生都无法弄清楚。我们有一个基于网络的 CRM 系统,可以创建一些文档。我正在使用 Chrome 来保存...

回答 1 投票 0

发票 OCR 模型构建指南

我正在做最后一年的项目,我真的需要一些建议。该项目是关于构建一个 OCR 模型来扫描发票,这些发票既有手写的,也有计算机生成的文本......

回答 1 投票 0

如何捕捉并处理屏幕上0.2秒闪烁的文字?

我正在尝试构建一个Python脚本,它可以检测在屏幕上闪烁很短时间(大约0.2秒)的文本。我使用 mss 进行屏幕捕获,使用 pytesseract 进行 OCR。下面我...

回答 1 投票 0

在 python 中提取条形码以及图像或 pdf 文件中其他详细信息的最佳方法

我有一项任务要求我以结构化格式从 pdf 或图像中提取订单详细信息。 我的方法是找到条形码区域,然后对每个条形码区域上方的文本进行 OCR。 最后的...

回答 1 投票 0

如何从倾斜的图像中返回正确对齐的文本?

我正在使用 doctr 对倾斜的图像执行 OCR。像这样的东西: 尽管 OCR 可以准确识别单词,但返回的文本是根据倾斜图像的坐标进行组织的。一个...

回答 1 投票 0

如何使用Python检测图像中的二维数据矩阵

我有一组医疗表格,页面的一角可能包含也可能不包含二维数据矩阵。我需要检测二维数据矩阵是否存在。目前,没有必要阅读

回答 1 投票 0

如何从Document AI自定义提取器的JSON输出中提取有价值的信息?

我正在 Document AI 中使用一个简单的自定义提取器,它尝试在上传的任何 pdf 中查找以下字段: 国家 名字 地址 国家 邮件 地址 城市 我正在使用以下...

回答 1 投票 0

Paddle OCR 检测置信度

我有一个关于 Paddle OCR 检测模型的问题。 Paddle OCR 输出结果是边界框的坐标、识别的文本和置信度分数,来自我的研究

回答 1 投票 0

计算用于 OCR 评估的字符混淆矩阵?

我正在处理 OCR 任务,出于评估目的,想要计算我的模型的混淆矩阵。我希望它基本上显示一个角色被正确预测的频率以及它的频率

回答 1 投票 0

字符串操作 - 是否可以从 Google Cloud Vision OCR 中删除输出文本中不可预测的额外空格?

目前存在不可预测的额外空格,如下两个样本(OCR结果);而Google此时还没有完全修复它;因此,我们正在寻找后期处理(Do String Manipulat...

回答 1 投票 0

我如何从头开始创建模型以从扫描的发票中提取文本和表格数据

所以我目前正在进行一个项目,我们收到了 25 种不同的发票类型,全部都是扫描的。最终目标是从发票中提取文本和表格数据,然后最终解析...

回答 1 投票 0

去除图像中的噪声,以便使用 OCR 处理文本

我需要处理一系列图像,然后使用OCR对其进行处理以获得这些图像中出现的文本。 彩色图像中的文本不够清晰,OCR 无法清楚地识别...

回答 1 投票 0

如何检测自然文本图像中的字符?

我有一个关于字符识别的项目(使用openCV库)。 我不知道如何检测文本图像中的字符。 你能推荐一些方法来做到这一点吗? 谢谢大家!

回答 1 投票 0

与文档智能 - Azure 认知服务相关

我在文档智能工作室(以前称为表单识别器)中构建了一个组合模型。它旨在从具有不同模式的不同类型文档中提取不同字段。 T...

回答 1 投票 0

OCR.space 错误 99

我在我的网站上使用免费的 OCR.space api,并使用 base64Image 上传图像(从 html 文件中输入的仅 jpg 文件接收),并收到此错误: {“OCRExitCode&qu...

回答 1 投票 0

从图片中读取文本

我有一个图像,出于纯粹的好奇目的,我想阅读它,我还想自学如何阅读如此复杂的图像以供以后分析等。 一开始我尝试申请

回答 1 投票 0

如何在 Windows 上训练 Tesseract

我正在尝试训练 tesseract 在 Windows 上的工作。这个过程完成得很好,但是当我打电话给 tesseract.exe file.tiff 输出 运行后,文件为空。 我不知道发生了什么

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.