在学习算法和统计分类中,随机森林是一个集合分类器,包含在许多决策树中。它输出的类是各个树输出的类的模式,换句话说,是具有最高频率的类。
我正在用模型进行测试以预测能源需求的行为,数据集包含 1664 个日常数据,涵盖 2014-09-10 - 2019-03-31,问题是当试图预测它预测时.. .
是否可以通过 xgboost 训练具有多个连续输出(多重回归)的模型? 训练这样一个模型的目标是什么? 在此先感谢您的任何建议
我想使用以下代码将列类型更改为类别: df["地理"] = df["地理"].astype("类别") 然后,使用随机森林算法如下...
我使用sklearn的RandomForestClassifier在python中实现了随机森林算法。现在,我只需要为推理部分而不是训练部分用 C 语言复制它。 你知道吗……
ValueError:无法将输入数组从形状 (8,) 广播到形状 (9,)
所以我在 bmi 和他的年龄的帮助下练习了关于糖尿病患者饮食建议的 ML,我总共使用了 2 个数据集,它们是 input.csv 和 inputfin.csv,然后在分离之后......
我正在处理超过 400 万条记录的大数据,我想根据 9 个变量预测 3 个标签。我使用了 RandomForest,但它需要几个小时,我想知道是否有什么办法可以
我正在重新调整一位同事编写的随机森林脚本的用途,该脚本使用空间变量和 caret 包运行模型的 100 次迭代,但该脚本最初并不是用分类数据编写的...
当我使用集成机器学习实现我的数据集时,预测助燃气的结果比基本模型的结果多。为什么? 我使用 6 个模型(mlp、svr、随机森林、xgboost、elastic n...
使用 R 中的 randomForest 包,我能够训练一个随机森林,使整体错误率最小化。然而,我想做的是训练两个随机森林,一个首先最小化错误概率...
我正在使用随机森林构建预测模型,然后应用“锚定”方法来解释预测。在解释器代码行中,我有一个关于数组维度的错误。我
如何在 RandomForestRegression 中计算 MSE 标准?
我现在使用 sklearn.ensemble 中的 RandomForestRegressor 来分析数据集,我选择“mse”作为衡量分割质量的函数。但是我不太清楚mse是如何计算的。
如何在随机森林中进行包含缺失值的分类?我的计划是在不先进行数据预处理过程的情况下进行分类。我有困难...
我有一个名为 song_analysis 的数据集,它有 23 列,其中 3 列是角色(表演者姓名、歌曲名称、流派)l
我的目标是创建模型训练和测试以预测和找到最低的 RMSE 之后我必须使用训练模型预测来测试名为 ( scoringData 的第二个数据集,它没有我的
我希望在具有因变量“Class”为“Good”或“Bad”以及许多自变量(包括“Age”,“Du ...”的数据集上拟合装袋模型
我有这段代码,但它必须迭代超过 2000 列和 3000 行,有人可以帮我避免 for 循环吗? 数据是取自雅虎金融包的经典数据,因此它们具有 adj close, close,...
谁能澄清在运行机器学习算法之前 set.seed() 的最佳程序是什么? 我建立了一个随机森林模型,一个gbm模型和一个bart模型。 他们每个人都需要一个
NameError: name 'capture' is not defined
我正在编写一些人脸识别代码。我正在尝试将我拥有的 csv 文件合并到一个程序将读取的文件中,一旦它的准确度级别至少为 0.8 或更高...
我有分类数据集。在 sata 数据集中有 5 个分类,即 1、2、3、4 和 5。我对机器学习(随机森林分类器)进行建模以创建分类模型。呵呵……
我一直在尝试使用随机森林进行时间序列预测,遵循一些这样的例子。但是,我仍然不清楚如何预测超出最后一天的值......
sklearn RandomForestRegressor:可训练参数的数量
有没有办法从 sklearn RandomForestRegressor 中提取模型训练期间适合的(有效)可训练参数数量? 可训练参数的数量可用于