我正在玩kaggle(link)和xgboost的houseprices数据集。
为了改进我的模型,我想了解对目标变量(房屋的销售价格)执行日志转换是否有意义。我在cross_val_score中用neg_mean_absolute_error测量我的模型的性能。直觉上,我想对错误执行逆变换,但这不起作用。
# without transformation
cv_score.mean() = -16102.123159086292
# with transformation
y_t = np.log1p(y)
...
cv_score.mean() = -0.08614553190770206
np.exp1p(cv_score.mean()) = -0.08253929830217616
你有什么建议吗?
您应该使用转换将模型生成的预测转换回来。然后像在其他情况下一样评估模型