我使用 PaddleOCR 进行项目并在 https://github.com/PaddlePaddle/PaddleOCR/blob/main/doc/doc_en/models_list_en.md 获取训练模型。但一切都没有改变。 所以我希望训练自己的数据集。 我的数据集中有图像、框(x、y、宽度、高度)和文本。 但我不知道微调的数据结构以及要运行什么代码。 谢谢你,祝你有美好的一天。
ocr = PaddleOCR(cls=True,
use_angle_cls=False,
lang="korean",use_gpu=True,
rec_model_dir='/ocr/korean_PP-OCRv3_rec_train/'
)
enhancer = ImageEnhance.Contrast(object_crops[l])
factor = 2.5
enhanced_image = enhancer.enhance(factor)
result = ocr.ocr(np.array(enhanced_image))
ed=time.time()
ocr_result = result[0]