ocr 相关问题

光学字符识别，通常缩写为OCR，是将手写，打字或打印文本的扫描图像机械或电子转换为机器编码文本。

有没有有效的图像二值化方法可以处理不同亮度的文本？

我正在尝试对阿拉伯语手稿执行 OCR，但我在图像二值化方面遇到困难（即确保文本区域的强度为 0 且背景区域...

opencv computer-vision ocr image-segmentation

回答 1 投票 0

Python 提取和 OCR JBIG2 图像

我正在尝试在 Python 中 OCR 包含 JBIG2 编码图像的 PDF 文件。最初是从 PyPDF 开始的，我认识到这里的限制是 PIL：https://github.com/py-pdf/pypdf/issues/1989 ...

python ocr tesseract jbig2

回答 1 投票 0

Mac M4 芯片（MPS）中的 TrOCR 微调

我在将设备切换到 mps 时遇到问题。我的训练在 cpu 上运行顺利，但是当我将设备设置为 mps 时，出现以下错误：运行时错误：视图大小与...不兼容

python macos pytorch ocr fine-tuning

回答 1 投票 0

阿曼车牌 OCR 预处理 - 字母识别问题

我正在开发阿曼车牌的 OCR 系统，并努力提高字母识别的准确性。这些盘子通常包含小而粗的字符，而我当前的预处理pi...

python computer-vision ocr automatic-license-plate-recognition paddleocr

回答 1 投票 0

使用 tesseract 从扫描的 pdf 文件中提取 csv 文本

我需要帮助从扫描的 pdf 中提取文本。我尝试使用 pymupdf、pillow 和 pytesseract 来提取它，但我没有得到正确的结果，有一些文本返回不正确......

opencv image-processing ocr python-tesseract mupdf

回答 1 投票 0

识别以任意角度旋转的 PDF 文件中的文本

我有一个简单的程序（来自 docTR 库文档的代码），可以识别 pdf 文件中的文本。如果文字完全对齐，那么文字识别就没有问题，但是...

python tensorflow ocr doctr

回答 5 投票 0

如何在图像的特定区域运行 Mindee doctr？

我正在使用下面的代码通过 Mindee/doctr 包从图像中提取文本。从 doctr.models 导入 ocr_predictor 从 doctr.io 导入文档文件导入 json 模型 = ocr_predictor( reco_arch='

python machine-learning ocr doctr

回答 1 投票 0

从java使用Tesseract

我正在尝试用java构建一个示例应用程序，它将读取图像文件并只输出从图像中提取的文本。我发现 Tesseract 项目看起来很有前途，但是，它......

java ocr tesseract

回答 7 投票 0

如何使用python从w2文件中提取信息

我想从几个以pdf格式存储的w2文件中提取信息并将该数据填充到excel文件中。我可以使用 doctr（文档文本识别）提取数据，但是，这...

python regex opencv computer-vision ocr

回答 1 投票 0

如何从现有数据创建 ALTO 文件？

我希望我的程序输出 ALTO 文件。我拥有创建它所需的所有数据，所以我想知道是否已经存在一些可以部署的代码来创建 ALTO 文件，而不是对其进行编码...

json xml ocr alto

回答 1 投票 0

从 PDF 中提取表格的最佳 python 模型/库

我有一些PDF，我想在其中提取表格数据，但问题是该表是多页的，我想检测该多页表并将其设为一页，还有多张桌子在...

python pdf ocr azure-form-recognizer python-camelot

回答 1 投票 0

快速检查PDF文件上的OCR文本图层

是否有任何程序可以让我将 PDF 的文本 (OCR) 层叠加在 PDF 渲染之上？我想快速查看文本图层是否有错误。这样会更方便...

pdf ocr

回答 2 投票 0

绘图数字化 - 从图形图像中抓取样本值

这并不是真正的“OCR”，因为它不识别字符，但它与应用于曲线的想法相同。任何人都知道图像处理库或已建立的用于检索值的算法......

image-processing charts plot ocr curve-fitting

回答 8 投票 0

如何创建一个简单的网站，使用 Google Vertext AI Vision API 将用户提交的图像转换为文本

我正在尝试构建一个简单的 html/css/jquery 网站，该网站使用 Google Vertext AI Vision API（或其他服务）将用户提交的图像转换为文本。如果有人能回答我，我将不胜感激

javascript html jquery ocr

回答 1 投票 0

如何从 PDF/扫描 PDF 中的图像中提取表格？

工作是从扫描的PDF中提取表格。我尝试使用 Camelot/tabula，但没有任何效果。关于如何提取表格有什么建议吗？例子 Camelot/tabula 没有一个检测到...

python ocr tabular python-camelot

回答 1 投票 0

在 Windows Python 中将不可搜索的 Pdf 转换为可搜索的 Pdf

需要一个解决方案将每个页面都是图像且页面可以包含文本、表格或两者的组合的 PDF 文件转换为可搜索的 pdf。我使用过 ABBY FineReader Online，它是...

python python-3.x pdf ocr

回答 4 投票 0

另存为 PDF 并保留文本

我一整天都在尝试解决这个简单的问题，但我一生都无法弄清楚。我们有一个基于网络的 CRM 系统，可以创建一些文档。我正在使用 Chrome 来保存...

pdf ocr

回答 1 投票 0

发票 OCR 模型构建指南

我正在做最后一年的项目，我真的需要一些建议。该项目是关于构建一个 OCR 模型来扫描发票，这些发票既有手写的，也有计算机生成的文本......

deep-learning ocr tesseract text-recognition handwriting-recognition

回答 1 投票 0

如何捕捉并处理屏幕上0.2秒闪烁的文字？

我正在尝试构建一个Python脚本，它可以检测在屏幕上闪烁很短时间（大约0.2秒）的文本。我使用 mss 进行屏幕捕获，使用 pytesseract 进行 OCR。下面我...

python ocr tesseract

回答 1 投票 0

在 python 中提取条形码以及图像或 pdf 文件中其他详细信息的最佳方法

我有一项任务要求我以结构化格式从 pdf 或图像中提取订单详细信息。我的方法是找到条形码区域，然后对每个条形码区域上方的文本进行 OCR。最后的...

python opencv ocr barcode pyzbar

回答 1 投票 0

ocr 相关问题

最新问题