当期望1d阵列时,传递列向量y

问题描述 投票:58回答:5

我需要适应RandomForestRegressorsklearn.ensemble

forest = ensemble.RandomForestRegressor(**RF_tuned_parameters)
model = forest.fit(train_fold, train_y)
yhat = model.predict(test_fold)

这段代码一直有效,直到我对数据进行了一些预处理(train_y)。错误消息说:

DataConversionWarning:当期望1d数组时传递列向量y。请将y的形状更改为(n_samples,),例如使用ravel()。

model = forest.fit(train_fold,train_y)

以前train_y是一个系列,现在它是numpy数组(它是一个列向量)。如果我应用train_y.ravel(),那么它就变成了一个行向量,并且没有出现错误信息,通过预测步骤需要很长时间(实际上它永远不会完成......)。

RandomForestRegressor的文档中,我发现train_y应该定义为y : array-like, shape = [n_samples] or [n_samples, n_outputs]任何想法如何解决这个问题?

python pandas numpy scikit-learn
5个回答
97
投票

改变这一行:

model = forest.fit(train_fold, train_y)

至:

model = forest.fit(train_fold, train_y.values.ravel())

12
投票

当我试图训练一个KNN分类器时,我也遇到过这种情况。但似乎在我改变后警告消失了: knn.fit(X_train,y_train)knn.fit(X_train, np.ravel(y_train,order='C'))

在这条线之前,我使用了import numpy as np


8
投票

使用下面的代码:

model = forest.fit(train_fold, train_y.ravel())

如果你仍然因为错误而得到以下相同的打击?

Unknown label type: %r" % y

使用此代码:

y = train_y.ravel()
train_y = np.array(y).astype(int)
model = forest.fit(train_fold, train_y)

2
投票

我有同样的问题。问题是标签是一种列格式,而它预计会连续排列。使用np.ravel()

knn.score(training_set, np.ravel(training_labels))

希望这能解决它。


0
投票

另一种方法是使用ravel

model = forest.fit(train_fold, train_y.values.reshape(-1,))
© www.soinside.com 2019 - 2024. All rights reserved.