我有一个使用多项式和径向基函数进行训练的模型,我将数据分为训练集和测试集,并从训练集中获取了许多样本。现在,我对下一步感到不知所措,我知道偏差是损失最少的样本的损失。我是根据火车数据还是测试数据计算得出的?方差仅仅是测试集上损失的方差吗?
此权衡的主要目标是为决策边界找到正确的复杂度。
高复杂度:(可以)记住过去,(可以)不对未来进行概括(高方差问题)
低复杂度:(由于决策边界非常简单,无法从过去中学到足够的知识,并且再次(可能)也无法很好地预测(高偏差问题)]]
这可以简单地用如下图显示,