我有一个非常大的数据集,并希望在数据集的分区上训练几个随机森林模型,然后平均这些模型以得出我的最终分类器。由于随机森林是一种集合方法,这是一种直觉上合理的方法,但我不确定是否可以使用scikit-learn的随机森林分类器。有任何想法吗?
我也愿意使用另一个包中的随机森林分类器,只是不知道在哪里看。
这是我能想到的:
总而言之,我会选择2。