我目前正在使用YOLOv3对象检测器开发用于板检测的深度学习模型,我在1470张图像上使用了VGG图像注释器,并以JSON和CSV格式导出了它们:VGG annotation in JSON format
[您可以看到我使用了多边形和矩形,因为某些板的形状很尴尬,我尝试将它们转换为YOLOv3格式的注解,但是这样做很麻烦。
任何帮助将不胜感激。
[classID, x_center, y_center, w, h]
,除了classID是一个整数外,其余所有四个数字都是分别由image_height (H)
和image_width (W)
规范化的0和1之间的实数。因此,要获得[x_min, y_min, x_max, y_max]
,需要[][x_0, y_0, x_1, y_1] = [x_center - w/2, y_center - h/2, x_center + w/2, y_center + h/2]
应用尺寸
[x_min, y_min, x_max, y_max] = [x_0, y_0, x_1, y_1] \dot_product [W H W H]