我正在拟合具有6个预测变量(3个连续变量和3个分类变量)的多元线性回归模型。残差与拟合图表明存在异方差性,也已通过bptest()确认。
此外,我还为火车数据和测试数据计算了sqrt,如下所示:
sqrt(mean(sales_train_lm_pred-sales_train$SALES)^2)
2 3533.665
sqrt(mean(sales_test_lm_pred-sales_test$SALES)^2)
2 3556.036
我试图拟合glm()模型,但仍然无法纠正异方差。
glm.test3<-glm(SALES~.,weights=1/sales_fitted$.resid^2,family=gaussian(link="identity"), data=sales_train)
resid vs. fitted plot for glm.test3看起来很奇怪。glm.test3 plot
您能帮我下一步做什么吗?
提前感谢!
您观察到数据的异方差意味着方差不是平稳的。您可以尝试以下操作:
1]将具有合适的Box-Cox transformation的单参数lambda
(对数变换是特例)应用于数据集中的一个或多个变量。最佳lambda
可以通过查看其对数似然函数来确定。看看MASS::boxcox
。
2)使用您的功能集(减少,增加,添加新变量)。
2)使用加权线性回归方法。