XG 提升不平衡数据集的结果解释(准确性& AUCROC)。

问题描述 投票:0回答:0

我的数据集的形状是 5621*8 (二元分类)

  • 实验室目标:成功(4324, 77 %) & 不成功(1297, 23 %)

    (重要的一点:我需要两个班级都有好的表现)

我把我的数据分成了3个部分(训练、验证、测试

  • 对于训练&验证,我执行10个褶皱的CV。

  • 测试是单独的数据,我对每个褶皱进行评估。

我调我的 scale_pos_weight 介于 5 to 80

  • 最后,我将我的数值固定为75,因为我的准确率平均较高。Test set (79 %) 为那十倍
  • 但是,如果我检查我的 average auc_roc metrics it is very pooronly 50 % for all 10 folds.

如果 我没有调整scale_pos_weight。 我的 avg.accuracy drops to 50% & my avg auc_roc increases to 70 %.

在这种情况下,我如何从上述结果中解读AUCROC &精度之间的关系?

在我的情况下,可能是什么问题?

python machine-learning metrics xgboost imbalanced-data
© www.soinside.com 2019 - 2024. All rights reserved.