因此,我正在训练 400 个图像数据集标签,其中包含大约 900 张图像,这些图像分为 80% 的训练和 20% 的验证。我在这里遵循tensorflow的指南(https://www.tensorflow.org/tutorials/images/transfer_learning_with_hub)
这是我的数据集(https://drive.google.com/drive/folders/1yIEig6K3g3Y2gFudkE0ca64UzkQtsORA?usp=drive_link)
这是使用 MTCNN 预处理的数据集
我应该更改我的数据集还是其他?
根据我的经验,使用 400 个标签和只有 900 个图像进行训练“这意味着每个标签只有 2-3 个图像”(我看到几个标签在训练数据集或测试数据集中只有一张图像)对于模型能够有效学习和概括。
即使你能以某种方式找到模型的完美微调,它仍然很有可能成为过拟合模型,这是坏模型的标志。它在训练中只记住了几个图像,没有学习到重要的特征。
我的建议是: