我无法理解 YOLO v1 研究论文中的以下文字:
我们使用平方和误差,因为它很容易优化, 然而它并不完全符合我们的目标 最大化平均精度。它对定位误差进行加权 同样地,分类误差可能并不理想。 此外,在每个图像中,许多网格单元不包含任何 目的。这会提高这些细胞的“置信度”分数 趋向于零,通常会压倒细胞的梯度 确实包含对象。这可能会导致模型不稳定, 导致训练早期出现分歧。 为了解决这个问题,我们增加了边界框的损失 协调预测并减少信心损失 对不包含物体的盒子的预测。我们 使用两个参数 lambda(coord) 和 lambda(noobj) 来完成此操作。我们 设置 lambda(coord) = 5 和 lambda(noobj) = .5
第一段中“压倒性”的含义是什么?为什么我们要减少置信度预测的损失(一定不能已经很低,特别是对于不包含任何对象的框)并增加边界框预测的损失?
有些单元格包含对象,有些单元格不包含对象。模型通常对网格单元中不存在对象(置信度为零附近)非常有信心,它使这些单元的梯度远大于包含对象的单元的梯度,但信心不高,它压倒了它们(即周围0.7-0.8)。 因此,我们希望考虑分类分数不太重要,因为它们不是很“公平”,为了实现这一点,我们使坐标预测的权重大于分类的权重。