tesseract 相关问题

Tesseract是一种OCR(光学字符识别)引擎,最初由惠普实验室开发,现在可作为开源库提供,由Google赞助开发。

如何获取用Python裁剪的图像的dpi? Tesseract --dpi 参数

我的代码打开一个 pdf,将第一页转换为图像,然后通过坐标从该图像中剪切出矩形,并使用 Tesseract 从每个剪切的矩形中提取文本。 我发现在...

回答 1 投票 0

Tesseract5-OCR 训练 - 分段故障错误

我正在尝试使用新字体训练 tesseract 5。我在 WSL Ubuntu 上运行 tesseract,并遵循 Gabriel Garcia 的教程和官方 tesseract 编译文档。我正在尝试训练 tesserac...

回答 1 投票 0

如何从内存中向 Tesseract 提供图像

我正在使用 Tesseract 对数百万个 PDF 进行 OCR,并且我正在尝试尽可能地发挥性能。 我当前的管道使用 Convert 将 PDF 转换为 PNG 文件(每页一个),并且...

回答 1 投票 0

Tesseract OCR 错误结果

我有这样的图片 当尝试使用 C# TesseractOCR 读取它们时,我有时会得到结果 38845283-05,这是不正确的,因为开头的“3”不应该在那里。

回答 1 投票 0

配置:错误:leptonica 库丢失(在 MinGW 上构建 tesseract-ocr-3.01 时)

运行配置时失败并显示 检查 leptonica...是的 检查 -llept 中的 pixCreate... 否 配置:错误:leptonica 库丢失 但我已经构建了leptonica 1.69(下载了...

回答 11 投票 0

如何让 Tesseract 正确检测图像中的文本?

我编写了一个简单的Python脚本,它从图像中返回文本。 导入CV2 导入 pytesseract 导入numpy 从 PIL 导入图像 def getText(img): # 接受 PIL.Image cvimg = numpy.a...

回答 1 投票 0

使用tesserocr遇到导入错误:在平面命名空间'__ZN9tesseract11TessBaseAPID1Ev'中找不到符号

我正在尝试在我的Python项目中使用tesserocr,但是当我尝试导入它时,我收到[No module named 'tesserocr'],我遇到了ImportError。错误消息指出缺少符号

回答 1 投票 0

tesseract-ocr 在 docker 内比本地慢

我已在基于基础映像 FROM:python:3.10 构建的 docker 容器中成功安装了 tesseract 5.3.1,并运行了一个脚本,该脚本采用 file_path 并通过启用 OCR 的 PyMuPDF 运行它(u...

回答 1 投票 0

如何在 Leptonica 中读取包含多页图像的 pdf

Tesseract 使用 leptonica 加载图像来进行 OCR: #包括 #包括 int main() { tesseract::TessBaseAPI *api = 新的tesseract::

回答 1 投票 0

当我在我的 Android 项目中实现 Google ML OCR Tesseract 时,没有获得正确的文本

我正在尝试在我的android项目中实现Google ML OCR Tesseract,并且我从我点击的图片中获得了一些随机文本。以下是我的代码: MainActivity 类:ComponentActivi...

回答 1 投票 0

如何使用 Tesseract(模式 --psm 2)仅进行页面分割/布局检测?

我想使用 Tesseract 中的页面分割而不运行 OCR,因为我有自己的自定义 OCR 模型,并且运行页面分割和 OCR 需要很长时间。我尝试使用 --psm 2 模式...

回答 1 投票 0

如何在Databricks上安装Tesseract OCR

我正在尝试在 databrick python 笔记本上运行以下脚本: pip 安装 presidio-image-redactor pip 安装 pytesseract python -m spacy 下载 en_core_web_lg 从 PIL 导入图像 来自

回答 2 投票 0

tesseract 提取无意义单词时不准确

我无法从图像中可靠准确地提取文本 导入CV2 导入 pytesseract pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR esseract.exe' 图像路径 = 'cr...

回答 1 投票 0

Tesseract 在特定情况下不读取零

我正在编写一个小软件,它通过网络摄像头读取另一个设备的终端输出(不,屏幕共享等是不可能的)。 这是我第一次使用tesseract,所以我就匆匆做了几个ro...

回答 1 投票 0

如何预处理图像以便tesseract可以轻松检测其中的文本

我有这张图片,我想检测它的文本。 该图像相对简单,但 Tesseract 仍然将文本检测为 LbOF。 我运行命令 tesseract foo.png - 输出是 估计...

回答 1 投票 0

将图像转换为黑白以在 R 中进行图像识别

我正在尝试获得一些自动文本识别的经验,并且我正在使用 tesseract 包对某些图像(即我拍摄的一些屏幕截图)执行 ocr。 为了提高我的表现

回答 3 投票 0

提高OCR准确性

我正在尝试编写一段代码来读取游戏日志并根据其内容发送消息以进行不和谐。到目前为止,代码运行良好,但我在 OCR 方面遇到了问题。有时它的准确性不好会导致

回答 1 投票 0

PyTesseract - 将 OCR 限制为一组字符

我在使用 pytesseract 时遇到了麻烦。我知道您可以使用命令行参数将超正方体限制为特定的字符集: tesseract input.tif 输出 nobatch 数字 我找到了一些人

回答 1 投票 0

使用 opencv4nodejs 为 tesseract 预处理图像

我正在尝试预处理这张图像。 然后,使用 Tesseract,我尝试读取右侧的数字,例如: 常量坐标 = [ 更多信息标签:{ x:740, y:165, 宽:112, 小时:326, ...

回答 1 投票 0

Tesseract 4.1.1 错误 eng.traineddata 在 google colab 中找不到

我正在尝试在google colab中安装tesseract 4.1.1。我已经安装了 tesseract,我可以使用 !tesseract --version 检查版本。之后我下载了 eng.traineddata 和 org.trained...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.