使用 lfw 数据集进行数据训练时验证准确性较低

问题描述 投票:0回答:1

因此,我正在训练 400 个图像数据集标签,其中包含大约 900 张图像,这些图像分为 80% 的训练和 20% 的验证。我在这里遵循tensorflow的指南(https://www.tensorflow.org/tutorials/images/transfer_learning_with_hub

这是我的数据集(https://drive.google.com/drive/folders/1yIEig6K3g3Y2gFudkE0ca64UzkQtsORA?usp=drive_link

这是使用 MTCNN 预处理的数据集

我应该更改我的数据集还是其他?

python tensorflow deep-learning dataset training-data
1个回答
0
投票

根据我的经验,使用 400 个标签和只有 900 个图像进行训练“这意味着每个标签只有 2-3 个图像”(我看到几个标签在训练数据集或测试数据集中只有一张图像)对于模型能够有效学习和概括。

即使你能以某种方式找到模型的完美微调,它仍然很有可能成为过拟合模型,这是坏模型的标志。它在训练中只记住了几个图像,没有学习到重要的特征。

我的建议是:

  1. 收集更多数据,在人工智能中,拥有更多(*和高质量)的数据总是更好
  2. 减少标签,我不知道预训练模型中每个标签有多少数据,但最好有相似数量的数据以给出平衡的数据集组成
  3. 如果您在收集数据时遇到问题,请对图像进行增强,有多种增强选项,例如饱和度变化、旋转、温度变化等。
© www.soinside.com 2019 - 2024. All rights reserved.