如何在多元线性回归中处理误差维？

Question

我正在尝试使用sklearn进行多元线性回归。

features_2 = ['chronic_disease_binary', 'outcome']

X = df.loc[:, features_2].values
Y = df.loc[:, ['age']].values
# X = pd.get_dummies(X,drop_first=True)
#
X_train_lm, X_test_lm, y_train_lm, y_test_lm = create_dataset_test(X, Y)
X_train_lm = X_train_lm.reshape((2596, -1))
lm = linear_model.LinearRegression()
model = lm.fit(X_train_lm, y_train_lm)
y_pred_lm = lm.predict(X_test_lm)

当我尝试对X_test进行tp预测时，我遇到了这个问题：

[ValueError：matmul：输入操作数1的核心尺寸0不匹配，带有gufunc签名（n？，k），（k，m？）->（n？，m？）（大小2与1不同））

我的X_train格式如下：

[[-0.77046461  1.29791815]
 [-0.77046461 -0.77046461]
 [-0.77046461  1.29791815]
 ...
 [-0.77046461 -0.77046461]
 [-0.77046461  1.29791815]
 [-0.77046461 -0.77046461]]

我的y_train就像这样：

[[59.]
 [54.]
 [40.]
 ...
 [24.]
 [33.]
 [41.]]

我进行预测的数据具有以下形式：

[[-0.76666002]
 [ 1.30435914]
 [-0.76666002]
 ...
 [-0.76666002]
 [-0.76666002]
 [-0.76666002]]

Answer 1

因为X_test_lm.shape的值为(1300, 1)，这意味着它只有1列，而不是2作为火车数据。在训练数据上训练的beta向量期望具有2列的矩阵，这会产生误差。

您应检查create_dataset_test的定义以了解如何达到此状态。

如何在多元线性回归中处理误差维？

问题描述投票：0回答：2

2个回答

最新问题

如何在多元线性回归中处理误差维？

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2