如何在给定火车数据样本的情况下量化偏差和方差

问题描述 投票:0回答:1

我有一个使用多项式和径向基函数进行训练的模型,我将数据分为训练集和测试集,并从训练集中获取了许多样本。现在,我对下一步感到不知所措,我知道偏差是损失最少的样本的损失。我是根据火车数据还是测试数据计算得出的?方差仅仅是测试集上损失的方差吗?

machine-learning statistics linear-regression
1个回答
0
投票

此权衡的主要目标是为决策边界找到正确的复杂度

高复杂度:(可以)记住过去,(可以)不对未来进行概括(高方差问题)

低复杂度:(由于决策边界非常简单,无法从过去中学到足够的知识,并且再次(可能)也无法很好地预测(高偏差问题)]]

这可以简单地用如下图显示,

enter image description here

© www.soinside.com 2019 - 2024. All rights reserved.