我在NN学习。我理解它是如何工作的粗略想法,但仍有一个不明确的事情。为什么我们在衍生品面前放减号?在衍生品本身是负面的情况下,它不应该只是衍生物吗?我的意思是如果a点的梯度已经是负数,则不应出现负号。不是吗?请帮忙。
反向传播中的衍生物正在回答这个问题:如果我增加体重(x),损失(y)会如何变化?
对于正导数 - 减少损失我们必须减轻重量。为了减轻体重,我们只需要减去正值。
对于负导数 - 减少损失我们必须增加重量。要做到这一点,我们需要减去负值。
对于这两种情况,我们需要使用与导数相同的符号来减去值。
w1 = w0 - derivative
衍生品也在回答问题损失会有多大变化?但它并不完全准确,因为它告诉我们多少,只有当前点的平坦斜率。为了更好地控制我们可以使用因子学习率多少
w1 = w0 - lr * derivative