损失纪元曲线看起来很奇怪。如何改进多类分类模型?

问题描述 投票:0回答:1

我对机器学习还很陌生。我正在使用 MobileNet 训练一组图像,以进行多类分类。训练后损失历元曲线如下所示:

我不确定如何解释这一点,如果这足够好/可以接受吗?但最后有一些峰值,所以我认为它不好?如何改善这一点?

tensorflow machine-learning deep-learning tf.keras
1个回答
0
投票

模型收敛时出现峰值是常见现象。 这个问题可以在许多 CNN 或基于 Transformer 的分类模型中观察到,例如“ResNet”论文中的图。

ResNet Loss curve

您可能还会注意到,许多损失曲线看起来非常平滑;这是因为他们采用“移动平均”来呈现更平滑的损失曲线。

因此,我建议训练更多的epoch来观察损失曲线的变化或者选择较小的学习率。此外,您可以利用检查点以最低的验证损失保存模型。

© www.soinside.com 2019 - 2024. All rights reserved.