random-forest 相关问题

在学习算法和统计分类中,随机森林是一个集合分类器,包含在许多决策树中。它输出的类是各个树输出的类的模式,换句话说,是具有最高频率的类。

Pyspark中的过采样或SMOTE

我有7个类,记录总数是115,我想在这个数据上运行Random Forest模型。但由于数据不足以获得高精度。所以我想申请过采样......

回答 2 投票 2

R: - 模型/变量长度不一致 - 随机森林

我正在尝试构建一个随机森林,但无论我如何努力处理NA并重新制定我的数据,我都会继续犯同样的错误,因为这似乎是...的最常见原因。

回答 1 投票 1

Python中的反向标签编码器功能

考虑下面的示例表,我正在尝试进行预测。正如您所看到的,我混合使用数字(Num1和Num2)和分类功能(Cat1和Cat2)来预测值,...

回答 1 投票 0

覆盖随机森林和提升的决策边界

我生成了一些随机数据,并试图根据使用随机森林和增强的拟合来覆盖决策边界。我可以在下面重现这个问题。我生成数据,并使用...

回答 1 投票 0

如何组合两个决策树对象?

我从随机森林分类器中选择了一些决策树对象(使用估算器)。现在我想将选定的决策树对象组合成一个对象。有人可以......

回答 1 投票 0

随机森林分类 - SciKit vs Weka预测有100个特征

我想获得一个比Weka更快的随机森林分类器,我首先尝试了C ++ Shark实现(结果:几个速度提升很少,正确分类的实例丢失)和...

回答 2 投票 4

randomForest库zip文件

我在政府机构工作,所以我不能直接下载R包,因为我们在防火墙后面。我向服务台请求下载randomForest库的权限。他们让 ...

回答 1 投票 0

如何更改pandas中多列的数据类型

我正在尝试在熊猫数据帧上运行随机森林。我知道数据帧中没有空值或无穷大但在我适合模型时不断得到ValueError。大概这是因为我......

回答 2 投票 2

防止随机森林回归量数据泄漏的建议

我目前的准确度和f1测量值均为1.00。我怀疑这是数据泄漏的结果。我正在寻找尽可能减少数据泄漏的技巧。谢谢。 ...

回答 1 投票 1

在Python中创建随机森林预测模型时遇到错误

我正在尝试使用本文中的脚本https://machinelearningmastery.com/implement-random-forest-scratch-python/在Python中实现随机森林算法,并根据...进行修改。

回答 2 投票 1

在尝试对我的随机forrest模型进行测试时,如何修复“功能数量错误”?

我有一个训练有素的模特。我想找出新数据属于哪个类。我做了一些试验,但我遇到了一些问题。使用open('text_classifier','rb')作为training_model:model = ...

回答 1 投票 2

classification_report中的值是什么意思

我有分类问题!我构建了2个模型,一个具有逻辑回归,另一个具有随机森林。我试图打印“classification_report”,我得到了下面的两张图片?哪一个 ...

回答 1 投票 0

如果用变量来设计因变量,我可以使用变量作为解释变量吗?

我正在尝试创建3种分类模型:朴素贝叶斯,随机森林和SVM。我试图预测的变量是电影判决,其类别为“点击”或“翻牌”。我设计了......的价值观

回答 2 投票 0

使用交叉验证拟合randomForest模型

我想交叉验证随机森林模型。我做到了这一点:但我不知道如何适应它。 sklearn.model_selection中的classifier = RandomForestClassifier(n_estimators = 100,random_state = 0)...

回答 1 投票 0

使用Scikit-Learn为Python中的随机森林绘制树

我想绘制一个随机森林的决策树。所以,我创建了以下代码:clf = RandomForestClassifier(n_estimators = 100)从sklearn导入树dotfile = 6导入pydotplus导入六....

回答 2 投票 15

如何将RandomForest二值化以在python中绘制ROC?

我有21个班级。我正在使用RandomForest。我想绘制一个ROC曲线,所以我在scikit ROC中使用SVM检查了该示例该示例使用SVM。 SVM具有以下参数:概率和...

回答 1 投票 1

当我有非常不平衡的数据时,我应该平衡测试集吗?

我使用Sklearn GridSearchCv来查找随机森林的最佳参数,当应用于4类(建筑物,植被,水和道路)的遥感数据时,问题是我有很多...

回答 1 投票 1

使用并行处理优化包randomForest速度

我如何获得以下代码(替代代码也会很棒),以便在并行方法中使用多个核心来提高回归方程的randomForest分析的速度? #...

回答 1 投票 0

没有适用于“mutate_”的方法应用于类“c”('integer','numeric')的对象

我的总体目标是使用随机森林对图像进行分类。数据框包含训练数据;其中'landcover'包含0,1和2类。我试图减少类的数量......

回答 1 投票 1

随机森林不预测零

我正在一个包含大量零的数据集上运行随机森林。这些零表示某事物(或其缺失)的计数,因此与可能的数据相比是有意义的......

回答 1 投票 -2

© www.soinside.com 2019 - 2024. All rights reserved.