我正在开发阿曼车牌 OCR 系统,并努力提高字母识别的准确性。这些图版通常包含小而粗的字符,而我当前的预处理流程并未产生令人满意的结果。
到目前为止我所做的是: 尝试过的 OCR 工具:
尽管进行了预处理和配置(--oem 3,--psm 6),PaddleOCR 和 Tesseract 仍难以进行字母识别。 预处理步骤: 尝试使用 Sauvola 和 Wolf-Jolion 二值化、缩放图像 (1.5x) 以及应用膨胀来增强文本。 问题:
字母仍然难以识别。
如何改进预处理,以更好地 OCR 识别小而粗的字母? 是否有任何 OCR 模型或自定义培训方法更适合像阿曼这样设计复杂的车牌?
车牌样本:
我参与过许多 OCR 架构的研究。我什至训练了 24 种不同欧洲语言的 ANPR 和印度的 ANPR。基本上没有用于车牌 OCR 的预训练识别器。您需要为此训练一个模型。您可以选择多种 OCR 架构,然后查看哪一种最适合您的应用程序。为了训练 OCR 模型,您需要首先准备车牌图像数据集。您可以抓取在线图像,从道路上的闭路电视摄像机中裁剪它们,手动标记它们或从亚马逊或谷歌等 OCR 服务中标记它们,并创建高质量的数据集。