我怎么能分辨出模型何时过于拟合?

问题描述 投票:0回答:1

我最近开始对机器学习进行一些研究,我有一个代码来评估SNN和ANN对合成数据中运动事件进行分类的适用性,重点是它们的速度(推理时间)和准确性。当我绘制损失和准确性曲线时,在我看来,模型过于拟合,尽管我检查了Chat GPT和DeepSeek,并且都提到这不是,这些结果是由于任务太简单了,我可以依靠他们进行这种类型的分析?我怎么能知道该模型是否正确学习呢? 这是功能的数字;

损失和准确性功能的图

我尝试更改时期的数量,但结果非常相似。

培训数据集)
python machine-learning jupyter-notebook neural-network torch
1个回答
0
投票

您的数据集太小 您的数据集具有相同或非常相似的对象(数据集中没有唯一性)

模型的学习率太高

    时代太高了
  • how can I know each time when the model has learned properly or not
  • 现在让我们不要考虑提供有关模型准确性和内容信息的值或指标,这是检查模型性能或模型过高的最实际和最佳方法是测试您的模型,而不仅仅是依靠度量值(尽管它们确实提供准确的信息)
  • 创建一个名为
检验数据集的数据集,并以简单的术语确保该数据集在培训和验证数据集中是唯一的,如果您是在不同的背景和位置培训猫(x,y,z)的模型,请确保测试数据集包含(a,b,c)猫,以训练数据集的独特和位置

然后在数据集创建之后,运行推理或使用此数据集测试模型,那就是手动检查模型是否能够检测到唯一的数据而不是训练的数据,

关于您从聊天机器人中的回复提到的,是的,这可能是真的,而您却没有提及数据集的

卷,多样性和真实性

,我只能假设您的数据集是问题

task being too simple,可以说,您需要训练模型以执行数学操作

(概率,单词问题,排列)

,但是您只需要训练模型以执行简单的添加和乘法,然后是的,是的,您的模型将过于for for仅加法和乘法

尽管提到的示例不是现实的,但它可能会帮助您理解我想说的话

can I rely on them for this type of analysis ?
从否则上,部分否,基本上,它们只是通过搜索其数据库或网络或甚至通过培训过程中它所学的模式来处理人类语言并向这些人提供回应的模型

如果您不知道您不知道,那么它可以给一个想法/引发一个想法,首先是

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.