MobileNet-SSD输入分辨率

问题描述 投票:0回答:1

我有一个工作对象检测模型(罚款调整的MobileNet SSD),可以检测我的自定义小型机器人。我会给它提供一些网络摄像头镜头(将与无人机绑在一起)并使用实时边界框信息。

所以,我即将购买相机。

我的问题:由于SSD将输入图像调整为300x300,因此相机分辨率非常重要吗?更高的分辨率意味着更高的准确度(即使它无论如何调整到300x300)?在运行我的物体检测模型之前,是否应该在每帧将相机素材裁剪为1:1的宽高比?我应该将图像分成MxN裁剪段并逐个进行推理吗?

因为我的机器人非常小,无人机将在4米高度,所以我将有效地尝试检测输入图像上的一个非常小的点。

非常感谢任何一种智慧,谢谢。

object-detection object-detection-api
1个回答
2
投票

这些是很多问题,我会尝试回答所有这些问题。检测模型在输入图像通过一些调整大小的方法(例双线性。如果输入图像等于或大于网络的输入大小而不是更小,那么当然会更好。一个经验法则是,确实更高的分辨率意味着更高的准确性,但它高度依赖于设置和任务。如果你试图检测一个小物体,让我们说例如原始分辨率是1920x1080。然后在调整图像大小后,小对象将更小(像素方式),并且可能太小而无法检测。因此,实际上,将图像分割成较小的图像(可能具有一些重叠以避免由于对象分割而导致误检测)并对每个图像应用检测或使用具有较高输入分辨率的模型将更好。请注意,虽然您可以使用当前模型实现第一个模型,但您需要为后者培训一个新模型,可能需要进行一些架构更改(例如,添加SSD层和修改锚点,具体取决于您要检测的比例)。关于纵横比问题,你最需要保持一致。如果不保持原始宽高比,则无关紧要,但如果不这样做 - 在培训和评估/测试/部署中都要这样做。

© www.soinside.com 2019 - 2024. All rights reserved.