我一直试图找出为什么我的线性回归模型与sklearn的线性回归模型相比表现不佳。
我的线性回归模型(基于梯度下降的更新规则)
w0 = 0
w1 = 0
alpha = 0.001
N = len(xTrain)
for i in range(1000):
yPred = w0 + w1*xTrain
w0 = w0 - (alpha/N)* sum(yPred - yTrain)
w1 = w1 - (alpha/N)*sum((yPred - yTrain) * xTrain)
用于绘制训练集中的x值和y的预测值的代码
#Scatter plot between x and y
plot.scatter(xTrain,yTrain, c='black')
plot.plot(xTrain, w0+w1*xTrain, color='r')
plot.xlabel('Number of rooms')
plot.ylabel('Median value in 1000s')
plot.show()
我得到的输出如下所示https://i.stack.imgur.com/jvOfM.png
在使用sklearn的内置线性回归运行相同的代码时,我得到了这个https://i.stack.imgur.com/jvOfM.png
我的模型出错了可以帮助我吗?我尝试过改变一些迭代次数和学习率,但没有发生重大变化。
如果它有帮助,这就是colab上的ipython笔记本:https://colab.research.google.com/drive/1c3lWKkv2lJfZAc19LiDW7oTuYuacQ3nd
任何帮助都非常感谢