如何为XGBoost分类器设置最佳阈值?该算法中使用的默认值为0.5。我想知道是否可以使用任何功能/内置功能来更改此设置。
[如果使用python:您正在寻找predict_proba()
python API,而不是通常的predict()
API。使用predict_proba()
,您可以获得概率,然后可以根据阈值将其映射到任何类别。
由于您提到了spark mllib,所以您可能在xgboost4j中使用scala或java。在这种情况下,也存在选择。例如https://xgboost.readthedocs.io/en/latest/jvm/scaladocs/xgboost4j/ml/dmlc/xgboost4j/scala/Booster.html#predict(data:ml.dmlc.xgboost4j.scala.DMatrix,outPutMargin:Boolean,treeLimit:Int):Array[Array[Float]]
,您正在寻找outPutMargin