在学习算法和统计分类中,随机森林是一个集合分类器,包含在许多决策树中。它输出的类是各个树输出的类的模式,换句话说,是具有最高频率的类。
使用第二个数据帧训练模型,分成三个数据帧,在随机森林中使用更新的参数吗?
我对使用有限的高分辨率图像训练随机森林模型感到困惑。该模型按顺序使用拆分数据帧进行训练。具有第二个拆分数据框的模型是否会...
我正在尝试使用数值和分类数据创建随机森林预测模型。我知道使用编码,分类数据可以转换为数值数据,但是你...
我对 gridsearchCV 中的评分有疑问。 我有一个随机森林分类器,我正在使用 gridsearchcv 对其参数进行超调。 cross_val = sklearn.model_selection.RepeatedKFold(
我在 R 中使用带有 20 个解释变量的插入符号随机森林,其中一些是分类变量但采用数字编码。例如,一个分类变量是具有 6 个不同级别的土壤排水...
我想知道我是否可以在 sklearn 的 GridSearchCV 中使用预测而不是交叉验证来找到最佳分数? 我有一个不平衡的数据集,我使用 RandomUnderSampler() 得到一个
我有一组 23 个物种的 1385 个光谱。我正在做由物种 X 与其他 22 种物种组成的模型,以获得 2x2 混淆矩阵。然而,我的模型或预测都不起作用......
我正在尝试构建一个机器学习算法以根据我的数据进行预测,但我无法让它工作(以退出代码 0 结束,但没有输出)。我正在使用 Python 和
空间随机森林预测:在更精细的空间尺度上在看不见的位置进行预测时出现错误
我正在使用 R 中的包 spatialRF 进行空间随机森林回归 (SRFR) 任务。我有一个响应变量和 4 个预测变量,我正在粗略的空间尺度上执行 SRFR。我的目标是...
为什么 ranger predict 在重新应用于训练数据时会给出不同的数字?
我对机器学习很陌生。我正在尝试用 R 中的 ranger 库探索拟合随机森林。我的因变量是连续的——所以它将是一个回归树(而不仅仅是
如何计算 spatialRF::rf_spatial 函数的 distance.matrix
我在 R 中使用包 spatialRF 来执行回归任务。从包提供的示例中,已经预先计算了 distance.matrix 并将其用于函数 spatialRF::rf....
我使用sklearn RandomForestClassifier进行预测任务 from sklearn.ensemble import RandomForestClassifier model = RandomForestClassifier(n_estimators=300, n_jobs=-1) model.fit(x_train,...)
以安全正确的方式使用RandomForestClassifier的predict_proba()函数。
我正在使用Scikit-learn在我的数据集上应用机器学习算法。有时候我需要把标签类的概率实例化为标签类本身的概率。而不是有...
将上一个sklearn流水线步骤中的对象属性作为参数传递给下一步方法。
tl;dr: 有什么方法可以调用.get_feature_names()在上一步管道的拟合和转换数据上作为下一步管道的超参数?我有一个...
我是R的新手,我试图使用一个集合模型来生成一个 "是""否 "变量的预测。为了做到这一点,我使用caret使用随机森林(ranger)、LASSO(glmnet)来生成预测。
我试图创建一个栅格来显示随机森林预测和神经网络预测的一致和不一致之处。每个栅格都是6个土地类别的预测,我想创建一个新的 ...
我正在写一个结果分析,想改变我的MeanDecreaseAccuracy图,从执行随机森林后的变量重要性图。我想只取 ...
我有一个大的数据框架,有大约一百万条记录和19个特征(+1个目标变量)。由于记忆错误,我无法训练我的RF分类器(这是一个多类分类,有...
我有一个交叉数据集,重复了2年,2009年和2010年。我使用第一年(2009年)作为训练集来训练一个回归问题的随机森林,第二年(2010年)作为 ...
在Spark中,随机森林分类器的准确率和训练数据占据的分区数有关系吗?例如,我们将训练数据存储在10 ...