在学习算法和统计分类中,随机森林是一个集合分类器,包含在许多决策树中。它输出的类是各个树输出的类的模式,换句话说,是具有最高频率的类。
带有随机森林的ClassifierChain:为什么即使基本估计器可以处理 np.nan 也不支持它?
我正在使用 ClassifierChain 方法和 RandomForestClassifier 作为基本估计器来解决多标签分类问题。我遇到了一个问题,我的输入矩阵 X 包含 n...
我有关于 XGBoost 的问题。 你知道如何知道XGBoost中创建的树的数量吗? 与 RandomForest 不同,模型制作者决定制作多少棵树,XGBoost 基本上继续
我有一个线性回归随机森林模型,可以根据一组变量预测植物高度。 培训<- read.csv('/sers/me/Desktop/training_data.csv') rf_model <- randomForest(height ~ E...
我有一个数据集,其中包含从虚构公司购买商品的客户的个人特征。最初,我没有任何目标变量,只有它们的特征。我的目标是找到拍拍...
我的目标是计算客户离开公司的流失风险。我想到了这种方法: 生成代表 cos 中最突出特征的配置文件...
我正在开发一个项目,旨在使用一个包含已离开公司人员历史的数据库,并根据那些已经离开公司的人员的个人资料来计算在职员工离职的风险...
我使用 6 月数据集训练了随机森林模型来预测员工的 status_value,并使用 0.3 分割作为 test_size。我将代码片段包含在内,因为它本身可以很好地工作而无需......
在 python 中将 ee.Image.stratifiedSample 与 .smileRandomForest、.train 和 .classify 一起使用?
我想使用 .stratifiedSample 从具有四个类别(标记为 0-3,表示频谱索引一致)的集成层创建训练数据,然后使用该输出来训练 .
我正在使用随机森林模型和神经网络进行二元分类,其中使用 SHAP 来解释模型预测。我按照教程编写了以下代码以获得
我正在对几种机器学习模型(例如 svm、ann、随机森林和 knn)进行 covid 19 爆发预测。我很困惑如何比较哪个是最好的
我正在参加 Kaggle 竞赛 (https://www.kaggle.com/competitions/playground-series-s4e8),我们必须根据提供的数据预测蘑菇是否有毒。 这是...
通过 GridSearch 修复随机森林/梯度增强回归的过度拟合(不起作用,需要帮助):)
我目前正在为一个 Uni 项目通过 Python 中的随机森林和梯度增强算法进行回归。 代码正在运行,结果看起来很有希望,但我有一个问题......
下午好! 我从事营销分析工作,现在我的任务是在项目类别之间分配营销预算(假设为 100 万),以实现收入最大化。 我熟悉基本的
我使用 R 版本 4.4.1 和 randomForest 4.7-1.1 来预测具有 16 个变量的二元结果,其中 4 个是数值变量,12 个是因子变量。该数据由 2600 个观测值组成...
混合协同过滤和基于句子相似性的系统,用于根据用户输入的症状和位置进行医生推荐
我正在尝试使用以下混合协作过滤和基于句子相似性的推荐系统来解决根据用户的症状和位置推荐医生的问题
在 GEE 中计算 RF 回归超参数调整的 RMSE 时遇到错误“(...)List<FeatureCollection>。”
我正在 GEE 中对随机森林回归算法进行非常基本的超参数调整。在此过程中,我还想计算 RSME 来评估所述超参数调整。 我收到一个
如何针对大型数据集优化Python中RandomForestClassifier的超参数?
我正在解决这个问题,我认为 scikit-learn 中的 RandomForestClassifier 对于大型数据集来说是更好的解决方案。只是在尝试了这个之后,我发现它不准确......
RF 对于我的线性数据总是过度拟合。我尝试过超参数优化。这是一个普遍问题吗? 截距=2 下标数字 = ['\u2081', '\u2082', '\u2083', '\u2084', '\u...
我正在使用多种机器学习模型进行 AQI 预测。数据为日格式,共有1850条记录。我的火车 R2 分数约为 99,测试分数约为 91。这是差距吗...
有人知道如何解决这个问题吗? 我正在尝试使用生物气候变量建立物种分布模型 Naimi 的 sdm 包,2016 R版本4.4.1 错误: 型号 <- sdm(Species ~...