我即将开始注释我的图像来训练YOLOv3模型。在开始之前,我想确保在原始图像上创建注释是可以的。在训练之前调整图像大小后,注释会分别改变吗?或者我应该首先调整所有图像的大小然后开始注释?
没关系!您不必担心图像大小。您可以使用任何尺寸注释数据集,当您开始训练时,Yolo将根据网络大小调整训练图像的大小,例如: 416x416,608x608。
另请注意,在原始仓库中,如果在cfg文件中设置random = 1
,则在网络大小期间每10次更改一次。 random = 1
意味着Yolo每10次迭代改变网络大小,通过在不同分辨率上训练网络来提高精度是有用的。
根据Yolo论文:
但是,由于我们的模型仅使用卷积和池化层,因此可以动态调整大小。我们希望YOLOv2能够在不同尺寸的图像上运行,因此我们将其训练到模型中。我们不是修复输入图像大小,而是每隔几次迭代就改变网络。每10批次我们的网络随机选择一个新的图像尺寸大小。由于我们的模型缩减了32倍,我们从32的倍数中拉出:{320,352,...,608}。因此,最小的选项是320×320,最大的选项是608×608。我们将网络调整到该维度并继续训练。
但是,如果您正在使用AlexeyAB的repo,则调整大小过程将不会保持纵横比https://github.com/AlexeyAB/darknet/issues/232#issuecomment-336955485