我正在使用
xgboost
来解决分类问题。
我有一个基本问题。
您可以在下面找到训练集和测试集(未见)每轮的 AUC。
正如您所看到的,测试集的 AUC 接近 0。您能帮助我了解发生了什么吗?
我正在使用Python。
[0] test-auc:0.4375 train-auc:0.881865
[1] test-auc:0.25 train-auc:0.947957
[2] test-auc:0.166667 train-auc:0.982759
[3] test-auc:0.166667 train-auc:0.984674
[4] test-auc:0 train-auc:0.996169
[5] test-auc:0 train-auc:0.998723
[6] test-auc:0 train-auc:0.998723
[7] test-auc:0 train-auc:0.999361
[8] test-auc:0.041667 train-auc:1
[9] test-auc:0.041667 train-auc:1
[10] test-auc:0.041667 train-auc:1
[11] test-auc:0.041667 train-auc:1
[12] test-auc:0 train-auc:1
[13] test-auc:0 train-auc:1
AUC 为
0
意味着预测器对测试集中的所有样本预测了错误的类别。
查看训练集的 AUC,这意味着测试集的大小要么太小,要么您选择了错误的(相反)类来绘制测试预测的 AUC。
我也遇到同样的问题,有人知道是什么原因吗?