我是 R 新手,我的疑问非常基本。 我有几个因变量 (x) 和一个自变量 (y),我想通过 10 倍交叉验证生成不同的回归模型,以便选择更好的模型。我所有的价值观都是数字。
他们推荐我使用 Caret 包,我做了一些测试。我使用线性回归(lm 或 glm)没有遇到任何问题,但是当我使用 logreg 等其他回归时,我遇到了错误。
我介绍的是:
Datos_AGB <- read.table("plotstatistics.txt",header=TRUE)
ctrl <- trainControl(method = "repeatedcv", number = 10, repeats = 10)
modelFit <- train(AGB~HOMEmean+WDmean, data=Datos_AGB, method = 'logreg', trControl=ctrl)
我收到此错误:
Something is wrong; all the RMSE metric values are missing:
> RMSE Rsquared Min. : NA Min. : NA 1st Qu.: NA 1st Qu.: NA Median : NA Median : NA Mean :NaN Mean :NaN
> 3rd Qu.: NA 3rd Qu.: NA Max. : NA Max. : NA NA's :9
> NA's :9 Error in train.default(x, y, weights = w, ...) :
> Stopping 50: In eval(expr, envir, enclos) : model fit failed for
> Fold06.Rep01: ntrees=3, treesize= 8 Error in logreg(resp = y, bin = x,
> ntrees = param$ntrees, tree.control = logreg.tree.control(treesize =
> param$treesize), : some non binary data among binary predictors
我不知道是否需要引入其他参数或之前执行一些步骤。
我希望有人解释我如何解决这个问题以及如何获得非线性回归。
我所有的价值观都是数字
这就是问题所在。请注意错误消息
some non binary data among binary predictors
logreg
需要二元预测器。
最大
也许因变量是 y?