Ng的ML课程使用python：梯度下降

Question

我一直在尝试用python实现Andrew Ng的练习的解决方案，但不确定为什么我无法使梯度下降正常工作。这是我用于梯度下降的代码：

def gradientDescent(x, y, theta, alpha, num_iter):
  m=np.size(x,axis=0)
  for i in range(num_iter):
      hyp=np.dot(x,theta)
      theta = theta - (alpha / m) * np.dot(x.T,(np.dot(X, theta) - y))
      return theta
theta=gradientDescent(X, y, [[0],[0]], 0.01, 1500)

根据此代码，这是theta：array([[0.05839135],[0.6532885 ]])

所需值为：array([[-3.6303],[[1.1664]])

模型看起来像这样：plot

这里是我一直遵循的使用八度的代码：

function [theta, J_history] = gradientDescent(X, y, theta, alpha, num_iters)

m = length(y); % number of training examples
J_history = zeros(num_iters, 1);

for iter = 1:num_iters
    theta=theta-alpha*(1/m)*X'*(X*theta-y)
    J_history(iter) = computeCost(X, y, theta)
end

end

也为了找到参数，我尝试使用正态方程方法，它给出了准确的结果，这意味着其余代码正常。

Answer 1

您的代码看起来不错，除了第5行上的错字（大写X应该为小写x），并且从未使用过hyp变量。

我在一些玩具数据上尝试过，似乎可以正常工作：

theta_true = np.array([-3.6303, 1.1664])

n = 50
X = np.ones((n,2))
X[:,1] = np.linspace(0,5, n)
ytrue = np.dot(X, theta_true)
y = ytrue + np.random.randn(n)

plt.scatter(X[:,1], y, s=100, c='b', alpha=0.4)
plt.plot(X[:,1], ytrue, 'k--')

并运行了（清理过的）梯度下降代码：

def gradientDescent(x, y, theta, alpha, num_iter):
    m = np.size(x,axis=0)
    for i in range(num_iter):
        theta = theta - (alpha / m) * np.dot(x.T,(np.dot(x, theta) - y))
    return theta

theta = gradientDescent(X, y, [0,0], 0.01, 1500)
theta
# array([-3.81920963,  1.22926242])

这似乎离我很近。

Ng的ML课程使用python：梯度下降

问题描述投票：1回答：1

1个回答

最新问题

Ng的ML课程使用python：梯度下降

问题描述 投票：1回答：1

1个回答

最新问题

问题描述投票：1回答：1