用于图像去模糊的多尺度卷积神经网络

问题描述 投票:0回答:1

我最近重现了一个图像去模糊的深度学习模型,标题是 Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring,发表于 2017 年。论文提到在保留精细级别信息的同时利用粗略和中级信息时间,网络的输入和输出采用高斯金字塔的形式。

如图所示,模型架构由三层组成。我想知道为什么网络设置为三层而不是其他数字,这在论文中似乎没有详细解释。搜了一下高斯金字塔的介绍,发现层数好像不固定。我也搜索了高斯金字塔层数的影响,发现没有相关的帖子,所以我也很好奇高斯金字塔层数的影响以及如何合理设置层数。 enter image description here

如果您能回答我的问题或建议我一些与该问题相关的学习链接,我将不胜感激。

image-processing deep-learning neural-network gaussian-process
1个回答
0
投票

根据您引用的原始论文中提供的信息,作者解释了变量“K”代表的高斯金字塔有 3 个层次

我们按照分辨率递减的顺序定义比例级别(即 级别 1 为最精细的比例)。除非另有说明,否则我们使用总 K = 3 个秤。

接下来,作者解释说他们使用 3 尺度高斯金字塔来“利用粗略和中层信息,同时保留精细层次信息注意层次数和尺度是相同的。

在我们的模型中,更精细的图像去模糊是由更粗糙的尺度辅助的 特征。利用粗略和中层信息,同时 同时保留精细级别的信息,输入和输出 我们的网络采用高斯金字塔的形式。

最后,作者以以下声明结束该段,与使用单个图像的其他方法相比,他们在论文中描述的方法使用了 3 张图像。

请注意,大多数其他从粗到精的网络都将单个图像作为输入和输出。

在作者对比的单一图像方法中,您不需要高斯金字塔。根据作者的说法,正如您将传递“单个图像作为输入和输出”一样。

回答你的第一个问题:

我想知道为什么网络设置为三层而不是其他数字,这在论文中似乎没有详细解释。

根据以上信息,作者指出他们使用 K=3 的方法与其他 K=1 的从粗到细的网络形成对比。他们没有明确解释为什么选择 3 而不是 4 或 5 的原因,但正如我提到的,他们谈论使用 K=3 金字塔来利用粗略、中等和精细级别的信息。这似乎表明应该至少有 K=3 来利用 3 个级别上可用的信息。

关于你的第二个问题:

我也搜索了高斯金字塔层数的影响,发现没有相关的帖子,所以我也很好奇高斯金字塔层数的影响以及如何合理设置层数.

这个问题是在征求回答者的意见——这不是 StackOverflow 的工作方式(请参阅此处以了解意见与事实政策)。我不能告诉你如何合理地设置这个数字。我可以告诉您,您可能需要考虑以下因素来帮助您做出决定:

  1. 为什么增加高斯金字塔的层数会影响性能?
  2. 通过向高斯金字塔添加额外的层可以获得哪些有用的额外信息?

如果你能回答这些问题,那应该可以帮助你决定是否值得追求 K=4、K=5 等

© www.soinside.com 2019 - 2024. All rights reserved.