random-forest 相关问题

在学习算法和统计分类中,随机森林是一个集合分类器,包含在许多决策树中。它输出的类是各个树输出的类的模式,换句话说,是具有最高频率的类。

使用“iml”包评估 REEMforest 和 MERF 的变量重要性

我最近开始使用 LongituRF 包。 我正在将其拟合到一些数据,并且我想使用 iml 包评估变量的重要性。 我已经使用过 iml,我喜欢它

回答 1 投票 0

在Python中拟合随机森林模型时出现InvalidParameterError

rf = 随机森林分类器(random_state=25) cv_params = {'最大深度': [2,4,6,无], 'min_samples_leaf': [1,2], 'min_samples_split':[2,3], '最大特征':[...

回答 1 投票 0

使用随机森林时,scikit 中的“ValueError:max_features 必须位于 (0, n_features] ”

我有一个包含 20 个特征和 840 行的数据集。 我已经优化了分类器(随机森林)。我的参数是 n_estimators=100 和 max_features=5。 我想对每个

回答 1 投票 0

替换随机森林物品

我正在运行这里开发的R中的MRF示例。以下块可以完美运行: 设置.seed(0) 数据=矩阵(rnorm(15*200),200,15) #DGP 图书馆(pracma) X=数据[,1:3] y=crossprod(t(X),rep(1,3))*(1-...

回答 1 投票 0

随机森林分类器使用Top-N特征方法去除特征

我是数据科学和机器学习技术和流程的新手。我正在开展一个个人项目,该项目使用随机森林分类器预测 NBA 比赛的获胜者。我有那么...

回答 1 投票 0

混合模型(CNN + RF)超参数优化

我正在研究一种混合模型,该模型在全连接层结合使用 CNN(时间序列输入)和 H2oRandom 森林(表格数据输入)来解决回归问题。我想优化...

回答 1 投票 0

使用 Scikit-learn 确定 RF 模型中每个类的特征重要性

我有一个遵循one-hot编码模式的数据集,我的因变量也是二进制的。我的代码的第一部分列出了整个数据集的重要变量。我用了方法...

回答 2 投票 0

提高使用随机森林模型预测新数据的速度

我正在使用随机森林生成物种分布模型。这些模型试图根据各种环境属性来预测某个物种发生的概率。对于我...

回答 1 投票 0

宏观经济作为随机森林项目来替代

我正在运行这里开发的R中的MRF示例。以下块可以完美运行: 设置.seed(0) 数据=矩阵(rnorm(15*200),200,15) #DGP 图书馆(pracma) X=数据[,1:3] y=crossprod(t(X),rep(1,3))*(1-...

回答 1 投票 0

是否可以在 XGBoost 包随机森林中收集单个树预测?

我有一个使用 python 中的 xgboost 包制作的模型,我想知道是否可以在将单个树预测打包(平均)到 ca 之前存储和引用它们...

回答 1 投票 0

如何让RandomForestClassifier更快?

我正在尝试使用具有大约 100 万原始数据的 Twitter 情绪数据来实现 Kaggle 网站的词袋模型。我已经清理了它,但在最后一部分,当我应用我的特征向量和情感时......

回答 1 投票 0

R Tidymodels 随机森林分类:预测目标变量时出错

我有一个包含 90 个变量和 200000 个 obs 的数据集。它是不平衡的,因为只有 4% 的情况目标变量为 1,在所有其他情况下目标变量为 0。 我将其分为 2 组:拟合(185000)和保留

回答 1 投票 0

mtry 值取决于tuneGrid 范围,即使使用相同的种子

我正在尝试寻找条件随机森林的最佳 mtry 值。我在 caret::train 函数的帮助下做到了这一点,发现根据网格范围,我甚至得到了不同的最佳 mtry...

回答 1 投票 0

机器学习模型是否可以通过将其概率指定为“两者都不”来预测新数据不适合用于训练的任何类别?

我正在 python 中使用 sklearn.ensemble 中的 RandomForestClassifier 来训练 ML 模型。我有 2 个类/模型(比如 A 和 B)可以生成曲线。在输入中,每一行代表一条曲线,e...

回答 1 投票 0

跨多个模型的交叉验证折叠的一致性

我目前正在做一个机器学习项目,其中使用三种不同的模型:随机森林、AdaBoost 和梯度提升。对于每个模型,我将它们应用到一组

回答 1 投票 0

更新:np.arange(min(indp),max(indp),0.01) ValueError:具有多个元素的数组的真值不明确。使用 a.any() 或 a.all()

我有一个用于作物产量预测的随机森林回归器,它有 5 个与回归器相关的特征 ['Precipitation' ,'Min_Temp' ,'Cloud_Cover' ,'Vapour_Pressure' ,'Area'] 和我的依赖 va...

回答 1 投票 0

如何获得随机森林中每棵树的 OOB 分数?(scikit-learn)

scikit-learn中的RandomForestClassifier模型似乎只提供整个森林的总体袋外(OOB)分数。我想获得每棵树的obb分数。有什么想法吗?谢谢...

回答 2 投票 0

缺失数据的随机森林建模:寻求不需要插补或数据删除的包或方法

我有一个包含多个变量的数据集,其中包含缺失值,并且我不喜欢估算或丢弃它们。我有兴趣在处理错误时将随机森林模型拟合到这些数据......

回答 1 投票 0

随机森林与回归模型:为什么随机森林的 R 平方为负,而回归模型的 R 平方为正

#%% One-hot 编码 df = new_data.copy() single_value_columns = ['TriggerType', 'Cedent', 'SPRating','RiskModeler'] # 从列表中提取单个值 对于 single_value_columns 中的 col: df[c...

回答 1 投票 0

terra::predict() 直接应用于 spatraster

我在R中创建了一个随机森林模型,并希望使用terra中的predict()函数将其应用到spatraster对象。我可以将栅格转换为数据帧,而不是直接预测...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.