在学习算法和统计分类中,随机森林是一个集合分类器,包含在许多决策树中。它输出的类是各个树输出的类的模式,换句话说,是具有最高频率的类。
我正在处理超过 400 万条记录的大数据,我想根据 9 个变量预测 3 个标签。我使用了 RandomForest,但它需要几个小时,我想知道是否有什么办法可以
我正在重新调整一位同事编写的随机森林脚本的用途,该脚本使用空间变量和 caret 包运行模型的 100 次迭代,但该脚本最初并不是用分类数据编写的...
当我使用集成机器学习实现我的数据集时,预测助燃气的结果比基本模型的结果多。为什么? 我使用 6 个模型(mlp、svr、随机森林、xgboost、elastic n...
使用 R 中的 randomForest 包,我能够训练一个随机森林,使整体错误率最小化。然而,我想做的是训练两个随机森林,一个首先最小化错误概率...
我正在使用随机森林构建预测模型,然后应用“锚定”方法来解释预测。在解释器代码行中,我有一个关于数组维度的错误。我
如何在 RandomForestRegression 中计算 MSE 标准?
我现在使用 sklearn.ensemble 中的 RandomForestRegressor 来分析数据集,我选择“mse”作为衡量分割质量的函数。但是我不太清楚mse是如何计算的。
如何在随机森林中进行包含缺失值的分类?我的计划是在不先进行数据预处理过程的情况下进行分类。我有困难...
我有一个名为 song_analysis 的数据集,它有 23 列,其中 3 列是角色(表演者姓名、歌曲名称、流派)l
我的目标是创建模型训练和测试以预测和找到最低的 RMSE 之后我必须使用训练模型预测来测试名为 ( scoringData 的第二个数据集,它没有我的
我希望在具有因变量“Class”为“Good”或“Bad”以及许多自变量(包括“Age”,“Du ...”的数据集上拟合装袋模型
我有这段代码,但它必须迭代超过 2000 列和 3000 行,有人可以帮我避免 for 循环吗? 数据是取自雅虎金融包的经典数据,因此它们具有 adj close, close,...
谁能澄清在运行机器学习算法之前 set.seed() 的最佳程序是什么? 我建立了一个随机森林模型,一个gbm模型和一个bart模型。 他们每个人都需要一个
NameError: name 'capture' is not defined
我正在编写一些人脸识别代码。我正在尝试将我拥有的 csv 文件合并到一个程序将读取的文件中,一旦它的准确度级别至少为 0.8 或更高...
我有分类数据集。在 sata 数据集中有 5 个分类,即 1、2、3、4 和 5。我对机器学习(随机森林分类器)进行建模以创建分类模型。呵呵……
我一直在尝试使用随机森林进行时间序列预测,遵循一些这样的例子。但是,我仍然不清楚如何预测超出最后一天的值......
sklearn RandomForestRegressor:可训练参数的数量
有没有办法从 sklearn RandomForestRegressor 中提取模型训练期间适合的(有效)可训练参数数量? 可训练参数的数量可用于
X 有 29 个特征,但 RandomForestClassifier 期望 30 个特征作为输入
我正在尝试编写一个使用 RandomForestClassifier 预测乳腺癌的机器学习模型。代码如下所示: 从 sklearn.model_selection 导入 train_test_split 打印(“
我正在尝试制作决策树但优化采样值以使用。 我正在使用一组值,例如: 数据 1 数据 2 数据 3 值 100 300 400 ...
我正在尝试制作一个具有 3 个隐藏层的神经网络来区分信号和背景事件。我正在使用由蒙特卡洛生成器生成的事件。 我面临的问题是 nu...
我使用随机森林来预测类别。现在,我正在尝试绘制每个班级的变量重要性。我使用了下面的代码,但它并没有为我提供 varImp 类,而是 givi...
我想将随机森林技术应用于我的时间序列数据。首先,我只是想加入一堆回归变量,并想为我的模型生成最佳数量的树。 然而,e...