在 PyTorch 中使用不同分辨率图像训练 DeepLabV3 的最佳实践

Question

我正在尝试在 COCO 2017 数据集上训练 PyTorch 的 DeepLabV3 进行语义分割，但我不确定如何处理不同分辨率的图像。我知道 DeepLab 的架构可以毫无问题地处理它们，但由于它们的分辨率，我无法批量堆叠它们。处理这个问题的最佳实践是什么？我是否将它们调整为固定大小？我是否随机裁剪固定尺寸的图像？我知道这个问题有很多解决方案，但我真的不知道语义分割训练背景下的最佳实践是什么。

谢谢！

Answer 1

没有理想的选择，每种选择都有其优点和缺点。因此，我建议尝试所有有效选项并比较性能。您可以从以下选项开始：

您可以将图像调整为稍大的尺寸，例如 520x520。
您可以随机将图像裁剪为所需的固定尺寸，例如 512x512。
您可以通过先调整大小然后裁剪来使用这两个选项。

您可以尝试一个高级选项，即计算所有图像的宽度和高度，然后计算平均值。然后，使用平均宽度和高度将所有图像调整为。

在 PyTorch 中使用不同分辨率图像训练 DeepLabV3 的最佳实践

问题描述投票：0回答：1

1个回答

最新问题

在 PyTorch 中使用不同分辨率图像训练 DeepLabV3 的最佳实践

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1