tesseract 相关问题

Tesseract是一种OCR(光学字符识别)引擎,最初由惠普实验室开发,现在可作为开源库提供,由Google赞助开发。

Pytesseract 返回边界框内的文本

我目前正在尝试对一组文档进行命名实体提取。我的计划是: 使用 pytesseract 进行 OCR 提取文本 申请法学硕士来获取患者姓名、年龄等实体。 一...

回答 1 投票 0

在 pytesseract 中检索到错误的数字

我正在尝试使用 pytesseract 从在线图像中检索数据,但是结果非常糟糕,我想知道是否有办法改进它。 这是我的代码: 导入io 导入请求 ...

回答 1 投票 0

使用 Tesseract 无法识别图像中的单个字符

我尝试从附图中提取号码 [ 但我没有得到数字 8 作为输出。我也尝试过使用不同的 PSM 值,例如 6、10 等。 这是我到目前为止所拥有的: 图片=...

回答 1 投票 0

使用 Tesseract 界面进行 OCR

如何在 C# 中使用 Tesseract 的界面 OCR tiff 文件? 目前我只知道如何使用可执行文件来做到这一点。

回答 5 投票 0

如何训练 Tesseract 5 以识别旧扫描书籍中的阿姆哈拉语文本

背景 我正在尝试在用阿姆哈拉语(使用埃塞俄比亚文字)编写的扫描旧书上使用 tesseract 5.3.3。 tesseract 的 amh.traineddata 的主要缺点 埃塞俄比亚语类型的差异

回答 1 投票 0

从带图纸的专利中提取可编辑文本

我有一堆专利的扫描图像,我需要以某种方式将其转换为某种可编辑的形式(最好是 docx)。以下是一页的示例: 我使用 tesseract 成功提取了文本...

回答 1 投票 0

具有不同背景颜色和低对比度的 OCR?

我正在尝试使用 pytesseract 将图像转换为文本。它对于白色背景和黑色文本的图像效果很好,但对于对比度较低和颜色变化的图像则失败。 我已经尝试过...

回答 1 投票 0

R/Python:将 PDF 转换为表格

我的计算机上保存有一个 PDF 图像文件(例如“p1.pdf” - 这是原始文档的扫描副本) - 该文件看起来像这样(我添加了红线以显示

回答 2 投票 0

Tesseract.js OCR 如何正确设置页面分割模式(PSM、pageseg)以检测图像中的单个数字

我一直在使用tesseract读取各种数字(最多99,999.9),格式如下: OCR 失败的图像示例: 似乎 80% 的时间都能正确读取,但我需要 95% 的时间...

回答 1 投票 0

如何使用 pytesseract 修复这些错误?

我正在尝试创建一个非常简单的程序,可以扫描屏幕的特定部分并打印找到的任何文本。由于某种原因,我遇到了一系列我找不到的错误

回答 1 投票 0

带有 Chaquopy 的 Android Studio:Tesseract 未安装或不在路径中

我正在尝试创建一个 OCR Android 应用程序。我已经有一个 python 脚本,我正在尝试用 chaquopy 来实现它。我在 build.gradle 中做了必要的配置。 Python{ 版本...

回答 1 投票 0

如何在 Android 上将 Pytesseract 用于 Kivy 应用程序?

所以我计划将 Tesseract 用于 Kivy 应用程序。但我不确定它是否适用于 Android,因为在 Tesseract 中你必须提供可执行文件的路径。我在这里读过一篇关于此的文章,...

回答 1 投票 0

识别图像上的错误文字

这是我的图片: 这是我的代码: 导入CV2 导入 pytesseract pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR esseract" img = cv2.imread(r"C:\Users\xxx\

回答 1 投票 0

从 tesseract 上获取 osd 输出(需要脚本值拉丁语、西里尔语...)tika-server

我是一名初学者,目前使用 Tika 2.9.1 服务器版本,需要元数据中 OSD 的输出,特别是脚本的值(拉丁语、西里尔语等)。所以我的问题是

回答 1 投票 0

Pytesseract 真的很慢

所以我尝试从 MS Teams 读出文本并使用该文本在键盘上进行输入。 现在,我使用线程模块,让一个线程用于输入,一个线程用于

回答 2 投票 0

我在Godot中使用python实现了一个OCR程序,但导出时不起作用

我在Godot中使用python实现了一个OCR程序,但导出时不起作用。我在 Godot 项目文件夹内的虚拟环境中创建了 python 脚本。我导出的文件为

回答 1 投票 0

需要使用 pytesseract 在黑色背景上 OCR 红色文本:程序看不到红色

让我们从图像开始: 我当前的任务是使用 pytesseract 打印图像中的文本。 导入CV2 导入 pytesseract pytesseract.pytesseract.tesseract_cmd =“tesseract/tesseract.exe...

回答 1 投票 0

Tesseract OCR 力模式

我想用 Tesseract 读取特定的字符序列,就像这篇文章一样: Tesseract OCR:是否可以强制使用特定模式? 我已经尝试过在 Tesseract 中使用 pa 进行集市匹配模式...

回答 2 投票 0

vite 中 Process.env 未定义

我尝试将 Tesseract.js https://github.com/naptha/tesseract.js#documentation 与 Vue.js 一起使用,Vue.js 使用 Vite 作为捆绑器。 我的问题是我收到此错误: 无法读取未定义的属性 (

回答 3 投票 0

Tesseract可以用于僧伽罗语手写文字识别吗?

我希望恢复损坏的僧伽罗语手写文档。请告诉我:Tesseract 也可以用于僧伽罗语吗?

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.