在 PyTorch 中使用不同分辨率图像训练 DeepLabV3 的最佳实践

问题描述 投票:0回答:1

我正在尝试在 COCO 2017 数据集上训练 PyTorch 的 DeepLabV3 进行语义分割,但我不确定如何处理不同分辨率的图像。我知道 DeepLab 的架构可以毫无问题地处理它们,但由于它们的分辨率,我无法批量堆叠它们。处理这个问题的最佳实践是什么?我是否将它们调整为固定大小?我是否随机裁剪固定尺寸的图像?我知道这个问题有很多解决方案,但我真的不知道语义分割训练背景下的最佳实践是什么。

谢谢!

machine-learning deep-learning pytorch semantic-segmentation deeplab
1个回答
0
投票

没有理想的选择,每种选择都有其优点和缺点。因此,我建议尝试所有有效选项并比较性能。您可以从以下选项开始:

  1. 您可以将图像调整为稍大的尺寸,例如 520x520。
  2. 您可以随机将图像裁剪为所需的固定尺寸,例如 512x512。
  3. 您可以通过先调整大小然后裁剪来使用这两个选项。

您可以尝试一个高级选项,即计算所有图像的宽度和高度,然后计算平均值。然后,使用平均宽度和高度将所有图像调整为。

© www.soinside.com 2019 - 2024. All rights reserved.