我正在尝试在 R 中训练随机森林模型,数据是尺寸为 502x5477 的矩阵。
代码很简单:
random_forest_model <- train(target ~ .,
data = matrix,
method = “rf”,
importance = TRUE)
我正在具有以下规格的笔记本电脑上运行代码: MacOS:文图拉 13.5 芯片:苹果M1 CPU:8核 内存:8GB 固态硬盘:256GB
但它卡在停车标志处,甚至8小时后也没有发生任何事情。
你有类似的经历吗? 你是怎么解决的? 笔记本电脑有问题吗?
我认为,如果您使用
ranger
或 Rborist
来运行随机森林模型而不是 randomForest
包,您会发现它运行正常 - randomForest
包即使在稍大的数据集上也不能很好地工作,而这些包经过优化可以高效工作。如果您确实想通过 method
执行此操作,请将 caret
更改为“ranger”或“rborist”。否则,您可以直接在这些包中构建随机森林模型,例如
library(ranger)
ranger_forest_model <- ranger(target ~ ., data = matrix, importance = 'impurity')
library(Rborist)
rborist_forest_model <- Rborist(target ~ ., data = matrix, predFixed = TRUE)