我使用
ultralytics
训练了自定义对象检测模型,并将其转换为 Tensorflow Lite 格式。 现在,当我使用 tflite 模型对图像 (640x640x3) 进行预测时,结果是形状为 [1, 7, 8400] 的张量。
这是我的代码:
我在[1, 7, 8400]中发现:
1 - 批量大小
7 - 4 个边界框坐标(x_center、y_center、宽度、高度)+ 每个类 3 个概率
8400 - 640 像素/8 =80; 80x80=6400。 640像素/16=40; 40x40=1600。 640像素/32=20; 20x20=400。 6400+1600+400=8400
我正在寻找一种简单的方法来将此张量解码为边界框坐标和类概率。