在学习算法和统计分类中,随机森林是一个集合分类器,包含在许多决策树中。它输出的类是各个树输出的类的模式,换句话说,是具有最高频率的类。
我正在用 python 构建人工智能模型。我的模型说我的训练准确度为 99.9%,测试准确度为 95%,但是当我通过输入数据对其进行测试时,我得到了错误的结果。我正在使用 Ra...
如何从“派对”随机森林(cforest)中获取每棵树的响应(预测)?
我用 party::cforest 和 n_trees 训练了一个随机森林进行回归(连续响应)。 当使用“predict(type =“response”)时,得到的只是所有n_trees的平均值
RandomForest:eval(predvars,数据,env)中的错误:找不到对象
我正在尝试制作随机森林分类器,但我不断收到错误“eval(predvars,data,env)中的错误:未找到对象'紫杉二烯生物合成'”。我已经检查了我的...
有没有用 1000 个 parquet 文件训练二元分类的最佳方法?
我正在使用镶木地板格式的巨大数据集训练二元分类模型。但是,它有很多,我无法将所有数据填充到内存中。目前,我正在做如下的事情,但我面临着...
我正在使用 scikit-learn 构建两个二元分类模型——一个是随机森林,另一个是线性 SVM。我想比较输入特征与tra的相对重要性......
随机森林模型:如何在 R 中显示与目标变量显着相关的变量的 p 值
我在 R 中为 48 个变量的数据集制作了一个简单的分类随机森林模型。我对数据建模还很陌生。我生成了基尼杂质指数和 MDA 指标来确定显着性
我用 randomForest 包制作了一个很好的随机森林模型。但!!我的数据是重复测量的,因此我需要确保训练和测试数据中不使用相同的个体。我
我的测试和训练数据具有相同的列数,但 OneHotEncoder 创建不同大小的矩阵
我正在尝试创建一个具有单独的训练和测试数据集的模型。它们具有相同数量的列。当我尝试对分类特征进行编码时,由 OneHotEncoder 创建的矩阵出现了
KeyError: 'SimpleMLLoadModelFromPathWithHandle' while loading model
我一直在尝试为我的烧瓶应用加载我保存的随机森林模型, 我参考了这篇 tensorflow.org 文章,但是当我加载时出现此错误: 文件未找到错误: Op类型未注册...
关于如何不仅在叶节点中提取样本,而且在共享相同父节点的样本以及具有相同祖先的样本中提取样本的任何想法..等等(内部节点) 最后我想结束
我是 Python 和机器学习编码的新手。我正在做随机森林回归来预测我想要的值(在这个例子中我们称之为 FS1)。当我将数据集拆分为 0.7 以进行训练时...
我正在尝试绘制模型的形状值。但是,它的情节并不好。它给了我 2 个带有 2 个变量的图。虽然 shap 值有 65 个特征。它有8400、65、2个形状。还有我的测试
Google Earth Engine Random Forest - Forest Loss/Gain improve model
我是 Google 地球引擎的新手。我遵循了有关如何使用随机森林显示森林损失/收益的教程,但我发现该模型表现不佳。 我有两个数据集,Land...
如何使用 VIP 或 DALEXtra 等 R 包评估模型(随机森林)中两个特征的联合重要性?
我知道将这些包(VIP 等)与 tidymodels 一起使用来评估单个特征对随机森林等模型的贡献/重要性。但我想知道评估组合或联合
为什么我的特征重要性分数是0.00-0.08。这是否表明这些功能与我的模型无关? ## 排除 cols_to_exclude 中也不需要的列 X_train, X_test, y_train,
我正在用模型进行测试以预测能源需求的行为,数据集包含 1664 个日常数据,涵盖 2014-09-10 - 2019-03-31,问题是当试图预测它预测时.. .
是否可以通过 xgboost 训练具有多个连续输出(多重回归)的模型? 训练这样一个模型的目标是什么? 在此先感谢您的任何建议
我想使用以下代码将列类型更改为类别: df["地理"] = df["地理"].astype("类别") 然后,使用随机森林算法如下...
我使用sklearn的RandomForestClassifier在python中实现了随机森林算法。现在,我只需要为推理部分而不是训练部分用 C 语言复制它。 你知道吗……
ValueError:无法将输入数组从形状 (8,) 广播到形状 (9,)
所以我在 bmi 和他的年龄的帮助下练习了关于糖尿病患者饮食建议的 ML,我总共使用了 2 个数据集,它们是 input.csv 和 inputfin.csv,然后在分离之后......