tesseract 相关问题

Tesseract是一种OCR(光学字符识别)引擎,最初由惠普实验室开发,现在可作为开源库提供,由Google赞助开发。

用于从现有文本图像制作 Tesseract-OCR 5 训练文件的 GUI?

我有一些(19 世纪印刷的)文本,其中包含非标准的特定领域符号,Tesseract 目前无法将其检测为字母。我想要一些能够: 将文本分解为...

回答 1 投票 0

Tesseract 加载语言失败(Tess4j / Java / Netbeans)

我目前正在开发一个程序,该程序应该使用 OpenCV 和 Tessj4 检测图像中的字母和数字。为此,我从 https://gith 下载并安装了 Tesseract(版本 5.0.0 alpha)...

回答 2 投票 0

在 Windows 10 上安装 Tesseract OCR 时,Tesseract 不在您的路径中

我尝试在 Windows 10 系统上安装 Tesseract OCR,但安装后遇到错误“Tesseract 不在您的 PATH 中”。 我按照以下步骤安装了 Tess...

回答 1 投票 0

Tesseract 无法识别单个字符

如何表示: 用油漆创建新图像(任何尺寸) 将字母 A 添加到此图像 尝试识别 -> tesseract 将找不到任何字母 将此字母复制粘贴至此图像 5-6 次 尝试

回答 5 投票 0

使用tessaract和opencv从图像中提取文本

截图.png: 修改后的图像.png: 我正在尝试从图像中提取文本,但似乎我这样做了,尽管我认为我已经将图像处理为 v...

回答 1 投票 0

使用 Tesseract OCR 正确从图像中提取文本

我一直在尝试从该图像中提取粗体白色文本,但无法使其正常工作,似乎 9 被读作 3,而 I 被读作 1。 一直在查看各种网站,其中有...

回答 1 投票 0

从 LED 面板中提取文本

我需要提取下图中显示的千克(kg)值: 我手动裁剪图像以隔离文本部分,并应用了多种图像处理技术,例如灰度

回答 1 投票 0

使用 Tesseract 检测黑色背景上的白色字符

我对 Tesseract OCR 完全陌生。这个问题可能很简单,但我似乎无法使用谷歌找到答案。 基本上,我有一个包含两部分的图像:第一部分位于...

回答 2 投票 0

使用tesseract方法初始化时EMGU内的Tesseract 5异常

在 EMGU 中使用 Tesseract,一个 Tesseract 对象 Emgu.CV.OCR.Tesseract 被建造。然后在初始化 Init(dataPath As String, language As String, mode As Emgu.CV.OCR.OcrEngineMode) 时,三段...

回答 1 投票 0

如何解析使用 Tesseract 将图像转换为文本得到的字符串?

我正在开发一个简单的JavaScript代码来从图像中提取文本。为此,我使用像 Tesseract 这样的图像处理库。 但我发现,Tesseract 并不是 100% 准确。 (或者我可能不知道...

回答 1 投票 0

仅使用 PDFMergerUtility 后如何关闭 pdf?

我的问题是,我将一堆 pdf 合并为一个,完成后,我无法删除从中创建合并文件的 pdf 文件。 以下代码示例是有问题的部分。 //合并PDF

回答 2 投票 0

Python 的 Tesseract - 奇怪的 OCR 结果 - 转换数字行但无法转换每个单独的数字

在 python 中使用 Tesseract 并得到不一致的 OCR 结果 - 它可以正确转换数字行,但无法转换每个单独的数字。 例如,对于此图像 1 Tesseract 给出了正确的 r...

回答 1 投票 0

非结构化partition_pdf找不到tesseract

我正在尝试在Windows计算机上使用来自Unstructed的partition_pdf函数和strategy =“hi_res”。该函数一直失败,因为它找不到 Tesseract 的路径

回答 1 投票 0

Tesseract 不使用自定义语言.traineddata 文件

我正在尝试向 OCR 教授一种新字体,Beaufort for LOL。 为此,我遵循了使用 QT-Box 编辑器的视频中的教程:https://youtu.be/N5Y6gZgvryQ 但完成所有步骤后...

回答 1 投票 0

使用 python-tesseract 获取识别单词的边界框

我正在使用 python-tesseract 从图像中提取单词。这是 tesseract 的 python 包装器,它是一个 OCR 代码。 我使用以下代码来获取单词: 导入超正方体 API =

回答 9 投票 0

tesseract 训练希伯来语新字体

我在这里找到了本教程 https://www.youtube.com/watch?v=KE4xEzFGSU8 并尝试按照我 git 克隆了 tesseract 和 tesstrain 的说明进行操作 我从这里添加了 heb.training_text https://

回答 1 投票 0

Pytesseract 返回边界框内的文本

我目前正在尝试对一组文档进行命名实体提取。我的计划是: 使用 pytesseract 进行 OCR 提取文本 申请法学硕士来获取患者姓名、年龄等实体。 一...

回答 1 投票 0

在 pytesseract 中检索到错误的数字

我正在尝试使用 pytesseract 从在线图像中检索数据,但是结果非常糟糕,我想知道是否有办法改进它。 这是我的代码: 导入io 导入请求 ...

回答 1 投票 0

使用 Tesseract 无法识别图像中的单个字符

我尝试从附图中提取号码 [ 但我没有得到数字 8 作为输出。我也尝试过使用不同的 PSM 值,例如 6、10 等。 这是我到目前为止所拥有的: 图片=...

回答 1 投票 0

使用 Tesseract 界面进行 OCR

如何在 C# 中使用 Tesseract 的界面 OCR tiff 文件? 目前我只知道如何使用可执行文件来做到这一点。

回答 5 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.