xgboost 相关问题

XGBoost是一个用于在R,Python,Java,Scala和C ++中构建增强树模型的库。将此标记用于特定于包的问题(即输入/输出,安装,功能)。

spark XGBoost分类模型的阈值

如何为XGBoost分类器设置最佳阈值?该算法中使用的默认值为0.5。我想知道是否可以使用任何功能/内置功能来更改此设置。

回答 1 投票 0


XGBoost中功能的时间稳定性(从GLM角度来看)

从GLM的角度来看,我在构建数据驱动的模型方面有很多经验(类似于用于购买某些商品的消费者的转换模型)。通常我使用的数据集来自几个...

回答 1 投票 0

XGBoost-自定义损失函数

关于在xgboost中使用自定义损失函数有两种不同的准则。如果预测概率'p'= Sigmoid(z)在https://github.com/dmlc/xgboost/blob/master/demo/guide-python / ...

回答 1 投票 0

scala类中的设置参数

我试图熟悉Scala(spark)中的类,并通过XGBoostClassifier编写了一个简单的包装器类进行试验。包装器类准备就绪后,我尝试设置一些...

回答 1 投票 -1

使用XGBoost(棘手的时间序列)在ML中进行预测

大家好,新年快乐!我有一个数据集,其中包含过去3年中1000家公司商店的每日销售观察数据(当然,仅从销售数字来看,我有以下特点:...

回答 1 投票 0

正在加载XGBoost模型:ModuleNotFoundError:没有名为'sklearn.preprocessing._label'的模块

我在使用以下代码加载预训练的xgboost模型时遇到问题:xgb_model = pickle.load(open('churnfinalunscaled.pickle.dat','rb'))当我这样做时,出现以下错误: ...

回答 1 投票 1


如何在PySPARK中使用XG-Boost

[谁能推荐任何有关如何将XGBoost与PySpark结合使用的解决方案,而不是Spark-Scala,第二,如果不与Pyspark结合使用,XGBoost是否会提高性能?主要是在做...

回答 1 投票 0

梯度提升分类器问题

我很想解决“未定义名称'XGBClassifier'的问题”。有什么线索吗?我的环境是Win 64,Python 3.7

回答 1 投票 0

如果我在XGB模型中具有主要功能,该怎么办?

我最近在我的数据集中遇到了“奇怪”的观察。在使用20个特征进行XGB建模之后,我绘制了具有最高增益值的前10个特征。结果如下所示:F1 140027.061202 F2 ...

回答 1 投票 0

使用多输出XGB进行增量学习

[我正在尝试用XGB执行增量学习,并用Sklearn的MultiOutputRegressor包装以获得多类回归:#例如#X = np.zeros((1,8)#y = np.zeros((1,32) ...

回答 1 投票 0

使用XGBoost H2O的糟糕表现

使用H2O上的XGBoost实现的模型性能非常不同,我正在针对非常不平衡的二进制分类问题使用5倍croos验证来训练XGBoost模型。数据集有1200列(...

回答 1 投票 0

在某些情况下,差异是Python中xgb.train和xgb.XGBRegressor之间的值

[我注意到这里和这里都讨论了Python中XGBoost的两种可能的实现,当我尝试通过两种可能的实现运行同一数据集时,我注意到...

回答 1 投票 1

xgboost:前几轮没有学到任何东西

[当我训练xgboost并使用AUC作为评估性能的指标时,我注意到前几轮的AUC分数始终为0.5。基本上,这意味着前几棵树没有学到...

回答 1 投票 0

如何从jupyter的xgboost库中隐藏警告?

不起作用:导入警告warnings.filterwarnings('ignore')我得到的警告:[14:24:45]警告:C:/Jenkins/workspace/xgboost-win64_release_0.90/src/objective/regression_obj.cu: 152:reg:linear ...

回答 1 投票 2

无法导入xgboost 0.9

在成功pip安装xgboost之后,运行时:将xgboost作为xgb导入时出现以下错误:xgboost.core.XGBoostError:无法加载XGBoost库(libxgboost.dylib)。 ...

回答 1 投票 0

Python-RandomForestClassifier和XGBClassifier具有完全相同的分数

问题:您能否帮助我理解为什么RandomForestClassifier和XGBClassifier得分完全相同?上下文:我正在研究Kaggle-泰坦尼克号问题,并且第一次尝试时,我想比较...

回答 1 投票 0

xgb.cv没有折叠,并根据数据的分割返回结果

我有一些数据,看起来像:#小标题:50 x 28 sanchinarro日期假期工作日周末工作日Weekday_on_holi ... weekly_on_holi ... protocol_active [[[[]]] 首先,应将数据分为dtrain(前40行)和dval(后10行)。其次,您需要xgb.train,而不是xgb.cv。 因此,您的代码应修改为类似的内容: library(xgboost) library(dplyr) # you code regarding ddd X <- ddd %>% select(-c(1:2)) Y <- ddd %>% select(c(1)) %>% pull() dtrain <- xgb.DMatrix(data = as.matrix(X[1:40,]), label = as.numeric(Y[1:40,])) dval <- xgb.DMatrix(data = as.matrix(X[41:50,]), label = as.numeric(Y[41:50,])) watchlist <- list(train=dtrain, val=dval) model <- xgb.train(data=dtrain, watchlist=watchlist, nround = 30, eta = 0.1, max_depth = 5) 恕我直言,仅40 + 10行,因此稀疏特征不希望使用XGBoost获得良好的结果。

回答 1 投票 0

从XGBoost模型获取实际特征名称

我知道这个问题已经问过几次了,我已经阅读了,但仍然无法弄清楚。像其他人一样,我的特征名称最后显示为f56,f234,f12等,而我...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.