random-forest 相关问题

在学习算法和统计分类中,随机森林是一个集合分类器,包含在许多决策树中。它输出的类是各个树输出的类的模式,换句话说,是具有最高频率的类。

随机森林/决策树输出概率设计:使用正输出叶子样本/总输出叶子样本

我正在使用 python 和 scikitlearn 设计一个二元分类器随机森林模型,其中我想检索我的测试集是两个标签之一的概率。据我了解,

回答 1 投票 0

如何计算随机森林预测的置信区间?

我正在计算一个名为“spot”的变量的预测(未来数据结果)。我使用随机森林和另一个名为“DTCI”的变量作为特征。预测已做出...

回答 1 投票 0

指标“ROC”不在结果集中。将使用准确度来代替

我正在尝试使用随机森林模型来预测目标特征。我想使用 ROC 指标,它位于 caret 包的 train() 函数中。然而,我一直在接受这种按摩,R...

回答 1 投票 0

无法在MacBook Air上运行R代码:随机森林模型训练

我正在尝试在R中训练随机森林模型,数据是尺寸为502x5477的矩阵。 代码很简单: 随机森林模型 <- train(target ~ ., data = matrix, method = “rf”,

回答 1 投票 0

在非参数设置中测试独立性的方法

我使用随机森林作为回归模型,并具有以下数据,其中 X 是单纯形形式的高维数据集。 数据链接: Y 数据集 X数据集 我尝试过使用 permuta...

回答 1 投票 0

eval(predvars,data,env)中的错误:找不到对象“适配器”

我正在尝试在 tf-idf 矩阵上训练随机森林分类器,其中列是评论中的单词。 得到一个想法: 标签...1实际上是适配器 1 0 0.01495934 0.02880089 2 ...

回答 1 投票 0

计算RandomForestClassifier和IsolationForest的内存使用量

我想评估一下两者都用了多少内存 sklearn.ensemble.IsolationForest sklearn.ensemble.RandomForestClassifier 但 sys.sizeof(my_isolation_forest_model) 系统大小(

回答 2 投票 0

当存在缺失数据时,使用 R 随机森林预测新数据

我想预测包含 NA 行的新数据。 我需要保持这些行在输入数据和预测输出中具有相同的行数。 我怎样才能用随机森林模型训练来做到这一点......

回答 2 投票 0

如何强制模型使用变量

我有用于训练二元分类模型的数据。 设置.种子(1) <- 20 dat <- cbind.data.frame(target=as.factor(sample(0:1,n,T)), price=round(rnorm(n)+1000,2), ...

回答 1 投票 0

如何恢复或转换one-hot编码列并显示原始特征的特征重要性而不是编码形式?

使用RandomForestClassifier,这是当前重要的功能列表: 帐单长度 0.367075 鳍状肢长度毫米 0.196314 帐单深度 0.153329 身体质量g 0.152304

回答 1 投票 0

我正在使用sklearn 1.4.1,但随机森林仍然无法处理缺失值

我读过 sklearn > 1.4 中的随机森林算法应该能够处理 NaN。我检查过我是否拥有最新版本的 Sklearn。 ! pip install --升级 scikit-learn 导入sklearn p...

回答 1 投票 0

将函数forest_model中的x轴更改为对数

我已经安装了这个物流模型: 型号 <- glm(Groupe~Cluster+age, family="binomial",data= base) And I'd like to present the results as a forest plot using this code: forest_model(model,

回答 1 投票 0

随机森林 - 针对 AUC 或 F1 分数进行优化

我在sklearn中使用随机森林,并且我的数据集相当不平衡(20%的正类,80%的其他类)。有没有办法让它针对某些指标进行训练(优化),并将其纳入

回答 2 投票 0

Class_weight 参数不会影响 RandomForestClassifier 不平衡数据集中的结果

我对机器学习还很陌生,现在我正在中型数据集中预测员工流失。我已经能够顺利运行一切,但是,由于数据集不平衡,我已经

回答 1 投票 0

Class_weight 不影响我的 RandomForestClassifier 结果

我对机器学习还很陌生,现在我正在中型数据集中预测员工流失。我已经能够顺利运行一切,但是,由于数据集不平衡,我已经

回答 1 投票 0

R包partykit函数cforest如何与applyfun参数一起使用以在Windows上进行多核并行处理

R partykit 包中的 cforest 函数有一个参数 applyfun,文档表明该函数可用于应用“带有参数 function(X, FUN, ...)&qu...的可选 lapply 样式函数”

回答 1 投票 0

尝试创建汇总图时,二元分类中 SHAP 值的数组形状不正确

我正在尝试使用 SHAP 为随机森林分类模型制作一个非常简单的汇总图。只是为了看看我是否能得到正确的语法,我生成了一个玩具示例并随机适合......

回答 1 投票 0

cross_validate得到的auc和RocCurveDisplay的值不同

在训练随机森林分类器后,我尝试了两种计算 AUC 分数的方法。第一个是从 cross_validate 函数获取指标: numeric_transformer = make_pipeline(

回答 1 投票 0

我想优化/从我的变量重要性图中删除一些东西

我目前正在尝试可视化我的变量重要性图,但我的图看起来都被压扁了。我对 R 不太熟悉,所以我想问是否有人知道如何使绘图更具可读性/更好

回答 1 投票 0

当我尝试了所有测试并且得到了合理的分数时,为什么我的混淆矩阵是这样的?

我正在使用 sklearn 的随机森林分类,除了混淆矩阵之外,我在所有方面都得到了不错的结果,这里是代码和结果 火车的标签分布...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.