在R中建造随机森林:RandomForest功能失败

问题描述 投票:0回答:0
my_data.csv

的数据。但是,为了重现性,这是在R.

中创建的一个简单数据集
# Load the necessary package library(randomForest) # Create a sample dataset set.seed(123) data <- data.frame( var1 = rnorm(100), var2 = sample(letters[1:3], 100, replace = TRUE), target = sample(0:1, 100, replace = TRUE) ) # Split the data into features (x) and target (y) x <- data[, -ncol(data)] y <- data[, ncol(data)] # Try to build the random forest model model <- randomForest(x = x, y = y, ntree = 500)

我确实在这个项目中进行分类。在我的初始帖子中,我应该更清楚。我的真实世界数据以及所提供的示例中的目标变量代表了分类类(在示例中,

target

变量具有0和1的值,是类标签)。
我期望

randomForest
功能建立一个分类 - 带有500棵树的面向随机森林模型。该模型应采用输入功能
x

,并使用它们来预测分类目标变量。成功执行后,我应该获得一个训练有素的模型对象,可以用来预测新数据类并评估可变重要性对于分类目的。

当我使用我的真实世界数据(来自
y

)运行上述代码时,我会遇到错误。但是,使用提供的示例数据,使用

my_data.csv

版本4.7-1.2,我收到警告:“响应具有五个或更少的唯一值。您确定要进行回归吗?”该警告表明该功能如何将我的数据解释为手头的任务可能存在问题。
    
使响应成为一个因素。
randomForest

giving

y <- factor(y)
 
model <- randomForest(x = x, y = y, ntree = 500)  
model
	

r random-forest
最新问题
© www.soinside.com 2019 - 2025. All rights reserved.