在搜索特定对象时,对为 YOLOv5 训练提供哪些图像的误解

问题描述 投票:0回答:1

我有很多我要搜索的螺丝示例图像,我有很多问题,教程似乎没有回答这些问题,他们只是用准备好的数据集完成整个过程,没有解释任何细微差别。

这些是我的示例螺丝图像,大约有 50 个。如果有必要,我可能会生成更多,但现在让我们保持这种方式。

我想要检测 3840x1960 图像中的这些对象。显然,我在每个图像上添加了一个文本文件“0 0.5 0.5 1 1”,因为每个正图像都是螺丝。

但是我误解了我还应该提供什么?有些指南说负面图像?它究竟意味着什么?我不寻找其他任何东西。添加什么?随机的东西?一张纸上这些螺丝会在哪里?如果我提供什么都没有的图像,它们的尺寸应该是多少?我会查看 3840x1960 图像,但 yolo 无论如何都会调整它们的大小,我应该提供整个背景,就好像没有螺丝一样,还是只是随机图片?

yolo 模型还将所有图像调整为相同大小?如果将螺丝尺寸调整为 96x96 而图像中的螺丝尺寸为 200x200 会怎样? 150×150?培训是否考虑到这一点?

请指导我并告诉我我的数据集应该是什么样子

python image-processing yolo yolov5
1个回答
0
投票

我维护的是 Darknet/YOLO 代码库和 YOLO 常见问题解答,而不是 YOLOv5。 所以我的一些回答可能并不100%适用。 但无论如何,我会尝试解决您提出的所有问题。

负样本应包含您期望在图像中看到的“背景”,而不包含您试图查找的对象。 对于大多数数据集,大约 50% 的数据集应该是负样本:https://www.ccoderun.ca/programming/yolo_faq/#negative_samples 图像的大小和物体的大小非常重要。 您需要了解它是如何工作的。 当 YOLO 将图像大小调整为网络尺寸时,存在大图像中非常小的对象的大小将被调整到您无法再“看到”它们的程度的风险。 请参阅常见问题解答:

https://www.ccoderun.ca/programming/yolo_faq/#how_does_sizing_work

话虽如此,一旦您理解了它的含义,那么您就可以继续讨论有关选择最佳网络尺寸的问题:

https://www.ccoderun.ca/programming/yolo_faq/#optimal_network_size

我还录制了一个视频尝试更好地解释这个概念:https://youtu.be/m3Trxxt9RzE 我更担心的是你创建的图像似乎只包含螺丝,并且你说你的注释覆盖了图像的 100%。 我不知道 YOLOv5 是否可以这样工作,但我可以肯定地告诉你,如果你这样做,Darknet/YOLO 将无法工作。 因为你本质上是在告诉网络你要搜索的对象应该占据图像的 100%。 常见问题解答中也对此进行了介绍:

https://www.ccoderun.ca/programming/yolo_faq/#crop_training_images

至于找不到指南和教程,我会再次向您指出 YOLO 常见问题解答。 请参阅此处的视频:

https://www.ccoderun.ca/programming/yolo_faq/#how_to_get_started

以及此处的数据集:https://www.ccoderun.ca/programming/yolo_faq/#datasets

© www.soinside.com 2019 - 2024. All rights reserved.