我正在尝试在 COCO 2017 数据集上训练 PyTorch 的 DeepLabV3 进行语义分割,但我不确定如何处理不同分辨率的图像。我知道 DeepLab 的架构可以毫无问题地处理它们,但由于它们的分辨率,我无法批量堆叠它们。处理这个问题的最佳实践是什么?我是否将它们调整为固定大小?我是否随机裁剪固定尺寸的图像?我知道这个问题有很多解决方案,但我真的不知道语义分割训练背景下的最佳实践是什么。
谢谢!
没有理想的选择,每种选择都有其优点和缺点。因此,我建议尝试所有有效选项并比较性能。您可以从以下选项开始:
您可以尝试一个高级选项,即计算所有图像的宽度和高度,然后计算平均值。然后,使用平均宽度和高度将所有图像调整为。