ocr 相关问题

光学字符识别,通常缩写为OCR,是将手写,打字或打印文本的扫描图像机械或电子转换为机器编码文本。

有没有有效的图像二值化方法可以处理不同亮度的文本?

我正在尝试对阿拉伯语手稿执行 OCR,但我在图像二值化方面遇到困难(即确保文本区域的强度为 0 且背景区域...

回答 1 投票 0

Python 提取和 OCR JBIG2 图像

我正在尝试在 Python 中 OCR 包含 JBIG2 编码图像的 PDF 文件。 最初是从 PyPDF 开始的,我认识到这里的限制是 PIL:https://github.com/py-pdf/pypdf/issues/1989 ...

回答 1 投票 0

Mac M4 芯片(MPS)中的 TrOCR 微调

我在将设备切换到 mps 时遇到问题。我的训练在 cpu 上运行顺利,但是当我将设备设置为 mps 时,出现以下错误: 运行时错误:视图大小与...不兼容

回答 1 投票 0

阿曼车牌 OCR 预处理 - 字母识别问题

我正在开发阿曼车牌的 OCR 系统,并努力提高字母识别的准确性。这些盘子通常包含小而粗的字符,而我当前的预处理pi...

回答 1 投票 0

使用 tesseract 从扫描的 pdf 文件中提取 csv 文本

我需要帮助从扫描的 pdf 中提取文本。我尝试使用 pymupdf、pillow 和 pytesseract 来提取它,但我没有得到正确的结果,有一些文本返回不正确......

回答 1 投票 0

识别以任意角度旋转的 PDF 文件中的文本

我有一个简单的程序(来自 docTR 库文档的代码),可以识别 pdf 文件中的文本。如果文字完全对齐,那么文字识别就没有问题,但是...

回答 5 投票 0

如何在图像的特定区域运行 Mindee doctr?

我正在使用下面的代码通过 Mindee/doctr 包从图像中提取文本。 从 doctr.models 导入 ocr_predictor 从 doctr.io 导入文档文件 导入 json 模型 = ocr_predictor( reco_arch='

回答 1 投票 0

从java使用Tesseract

我正在尝试用java构建一个示例应用程序,它将读取图像文件并只输出从图像中提取的文本。我发现 Tesseract 项目看起来很有前途,但是,它......

回答 7 投票 0

如何使用python从w2文件中提取信息

我想从几个以pdf格式存储的w2文件中提取信息并将该数据填充到excel文件中。我可以使用 doctr(文档文本识别)提取数据,但是,这...

回答 1 投票 0

如何从现有数据创建 ALTO 文件?

我希望我的程序输出 ALTO 文件。我拥有创建它所需的所有数据,所以我想知道是否已经存在一些可以部署的代码来创建 ALTO 文件,而不是对其进行编码...

回答 1 投票 0

从 PDF 中提取表格的最佳 python 模型/库

我有一些PDF,我想在其中提取表格数据, 但问题是该表是多页的,我想检测该多页表并将其设为一页 ,还有多张桌子在...

回答 1 投票 0

快速检查PDF文件上的OCR文本图层

是否有任何程序可以让我将 PDF 的文本 (OCR) 层叠加在 PDF 渲染之上? 我想快速查看文本图层是否有错误。 这样会更方便...

回答 2 投票 0

绘图数字化 - 从图形图像中抓取样本值

这并不是真正的“OCR”,因为它不识别字符,但它与应用于曲线的想法相同。 任何人都知道图像处理库或已建立的用于检索值的算法......

回答 8 投票 0

如何创建一个简单的网站,使用 Google Vertext AI Vision API 将用户提交的图像转换为文本

我正在尝试构建一个简单的 html/css/jquery 网站,该网站使用 Google Vertext AI Vision API(或其他服务)将用户提交的图像转换为文本。 如果有人能回答我,我将不胜感激

回答 1 投票 0

如何从 PDF/扫描 PDF 中的图像中提取表格?

工作是从扫描的PDF中提取表格。我尝试使用 Camelot/tabula,但没有任何效果。 关于如何提取表格有什么建议吗? 例子 Camelot/tabula 没有一个检测到...

回答 1 投票 0

在 Windows Python 中将不可搜索的 Pdf 转换为可搜索的 Pdf

需要一个解决方案将每个页面都是图像且页面可以包含文本、表格或两者的组合的 PDF 文件转换为可搜索的 pdf。 我使用过 ABBY FineReader Online,它是...

回答 4 投票 0

另存为 PDF 并保留文本

我一整天都在尝试解决这个简单的问题,但我一生都无法弄清楚。我们有一个基于网络的 CRM 系统,可以创建一些文档。我正在使用 Chrome 来保存...

回答 1 投票 0

发票 OCR 模型构建指南

我正在做最后一年的项目,我真的需要一些建议。该项目是关于构建一个 OCR 模型来扫描发票,这些发票既有手写的,也有计算机生成的文本......

回答 1 投票 0

如何捕捉并处理屏幕上0.2秒闪烁的文字?

我正在尝试构建一个Python脚本,它可以检测在屏幕上闪烁很短时间(大约0.2秒)的文本。我使用 mss 进行屏幕捕获,使用 pytesseract 进行 OCR。下面我...

回答 1 投票 0

在 python 中提取条形码以及图像或 pdf 文件中其他详细信息的最佳方法

我有一项任务要求我以结构化格式从 pdf 或图像中提取订单详细信息。 我的方法是找到条形码区域,然后对每个条形码区域上方的文本进行 OCR。 最后的...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.