我有关于 Paddle OCR 检测模型的问题。 Paddle OCR 输出结果是边界框的坐标、识别的文本和置信度分数,根据我在网上研究的内容,这里的置信度分数与识别器有关。有没有办法获得检测到的文本的置信度分数?在我的情况下,我想知道 Paddle OCR 在检测文本方面有多大信心,以及它检测到的内容是否是文本而不仅仅是随机涂鸦或只是集装箱上的生锈有多大把握?
提前致谢!
这是我的 ocr 结果:
OCR结果:[[[[[641.0, 65.0], [813.0, 61.0], [815.0, 130.0], [643.0, 134.0]], ('FRLU', 0.9880595207214355)], [[[645.0, 156.0], [953.0, 152.0], [954.0, 214.0], [645.0, 217.0]], ('8616911', 0.9634677767753601)], [[[640.0, 243.0], [816.0, 243.0], [816.0, 307.0], [640.0, 307.0]], ('42G1', 0.9629315733909607)]]]
要检查 PaddleOCR 识别的每个字符的置信度得分,您可以修改 BaseRecLabelDecode 类中的decode() 函数。该类位于您的虚拟环境中:
venv/lib/python3.9/site-packages/paddleocr/ppocr/postprocess/rec_postprocess.py
默认情况下,OCR 返回边界框中检测到的文本中所有字符的平均置信度得分。更新decode()函数将允许您在识别过程完成后单独访问每个字符的置信度分数。