在学习算法和统计分类中,随机森林是一个集合分类器,包含在许多决策树中。它输出的类是各个树输出的类的模式,换句话说,是具有最高频率的类。
R包partykit函数cforest如何与applyfun参数一起使用以在Windows上进行多核并行处理
R partykit 包中的 cforest 函数有一个参数 applyfun,文档表明该函数可用于应用“带有参数 function(X, FUN, ...)&qu...的可选 lapply 样式函数”
我正在尝试使用 SHAP 为随机森林分类模型制作一个非常简单的汇总图。只是为了看看我是否能得到正确的语法,我生成了一个玩具示例并随机适合......
cross_validate得到的auc和RocCurveDisplay的值不同
在训练随机森林分类器后,我尝试了两种计算 AUC 分数的方法。第一个是从 cross_validate 函数获取指标: numeric_transformer = make_pipeline(
我目前正在尝试可视化我的变量重要性图,但我的图看起来都被压扁了。我对 R 不太熟悉,所以我想问是否有人知道如何使绘图更具可读性/更好
当我尝试了所有测试并且得到了合理的分数时,为什么我的混淆矩阵是这样的?
我正在使用 sklearn 的随机森林分类,除了混淆矩阵之外,我在所有方面都得到了不错的结果,这里是代码和结果 火车的标签分布...
机器学习:为什么我的混淆矩阵是这样的?当我尝试了所有测试并且得到了合理的分数时
我正在使用 scklearn 的随机森林分类,除了混淆矩阵之外,我在所有方面都得到了不错的结果,这里是代码和结果 TRA的标签分布...
我对机器学习非常陌生,这是我作为大学课程的一部分正在从事的第一个项目。我选择了英国足球比赛。我选择使用随机森林。 使用
RandomForestClassifier GridSearchCV 和显式编码的 RandomForestCLassifier 之间的 roc_auc_score 不同
为什么具有特定参数的经过训练的 RandomForestClassifier 无法与使用 GridSearchCV 改变这些参数的性能相匹配? def random_forest(X_train, y_train): 来自 sklearn.en...
我收集了三个不同年份的丰度、混合分类群物种的数据,其中数据框的每一行对应于在独特地点观察到的物种。我从tr收集节肢动物...
RandomForestClassifier GridSearchCV 和显式编码的 RandomForestCLassifier 之间的 roc_auc_score 不同
为什么具有特定参数的经过训练的 RandomForestClassifier 无法与使用 GridSearchCV 改变这些参数的性能相匹配? def random_forest(X_train, y_train): 来自 sklearn.en...
为什么具有特定参数的经过训练的 RandomForestClassifier 无法与使用 GridSearchCV 改变这些参数的性能相匹配? def random_forest(X_train, y_train): 来自 sklearn.en...
我有一个很大的数据集,其中有很多缺失值。我在这里看到了处理原生 NaN 值的 SKLearn 算法列表:https://scikit-learn.org/stable/modules/impute.html#estimators-that-handle-nan-
部分依赖图 - 使用缩放数据开发的模型,如何取消 PDP 缩放?
我已经用Python制作了一个随机森林分类器模型,现在想要制作部分依赖图(PDP)。我使用缩放数据来训练和测试模型,并使 PDP 如下所示:
RandomForest n_estimators 计算 [已关闭]
我正在分析数据和训练模型,稍后将用于日期预测应用程序。目前,我的服务器上有大约 700 万行数据(表大小 = 6,400,000 行 x 8 列)。 我是
我正在运行 missForest,使用附近的传感器填充温度数据的时间序列。似乎填充值无法低于我尝试的传感器的最低观察值...
我知道通常使用种子设置,以便我们可以重现相同的结果。但是,在随机森林部分中设置种子实际上是做什么的。它是否改变了
我有一个包含 10,000 行和两列的数据框、段(具有 32 个值的因子)和目标(具有两个值“是”和“否”的因子,每个值 5,000 个)。我正在尝试使用随机森林来
调试 RandomForestRegressor() 在时间序列数据上产生主要恒定的预测结果
假设我的数据集包含一个时间戳(没有日期时间格式的非标准时间戳列)作为单个特征,并计为标签/目标以在以下 pandas 数据帧中进行预测...
我因 n_estimators 的最低值而获得最高分。据我了解,更多的树应该总是会提高性能。谁能解释一下这里发生了什么? 输入: # 是...
在 randomForestClassifier 上使用 GridsearchCV 时遇到的问题
我正在使用 RandomForestClassifier 处理与心脏病相关的分类问题。在对 RandomForestClassifier 执行超参数调整时,我面临以下问题。我是