我的 x 变量在我删除它后重新出现在我的回归模型中时遇到问题,因为它具有更高的 VIF 和 p 值。我会删除变量,检查回归模型以确保它已被删除,检查 VIF 分数,然后继续删除其他变量。在我第二次检查回归模型后,我注意到我的第一个变量又回来了。我似乎不明白为什么会这样,以及代码是否有问题。我添加了我的代码和一些 ols 回归的图片以显示它被删除然后重新出现在第二个中。
代码1:
x = x_train.drop('Bandwidth_GB_Year', 1)
x_train_lm = sm.add_constant(x)
lr_2 = sm.OLS(y_train, x_train_lm).fit()
print(lr_2.summary())
代码2:
x = x_train.drop('Children', 1)
x_train_lm = sm.add_constant(x)
lr_3 = sm.OLS(y_train, x_train_lm).fit()
print(lr_3.summary())
我为回归模型删除了一个 x 变量,检查了 VIF,然后删除了一个额外的 x 变量,但是一旦我检查了模型,我删除的前一个变量又出现了。