用于图像去模糊的多尺度卷积神经网络

Question

我最近重现了一个图像去模糊的深度学习模型，标题是 Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring，发表于 2017 年。论文提到在保留精细级别信息的同时利用粗略和中级信息时间，网络的输入和输出采用高斯金字塔的形式。

如图所示，模型架构由三层组成。我想知道为什么网络设置为三层而不是其他数字，这在论文中似乎没有详细解释。搜了一下高斯金字塔的介绍，发现层数好像不固定。我也搜索了高斯金字塔层数的影响，发现没有相关的帖子，所以我也很好奇高斯金字塔层数的影响以及如何合理设置层数。

如果您能回答我的问题或建议我一些与该问题相关的学习链接，我将不胜感激。

Answer 1

根据您引用的原始论文中提供的信息，作者解释了变量“K”代表的高斯金字塔有 3 个层次

我们按照分辨率递减的顺序定义比例级别（即级别 1 为最精细的比例）。除非另有说明，否则我们使用总 K = 3 个秤。

接下来，作者解释说他们使用 3 尺度高斯金字塔来“利用粗略和中层信息，同时保留精细层次信息”注意层次数和尺度是相同的。

在我们的模型中，更精细的图像去模糊是由更粗糙的尺度辅助的特征。利用粗略和中层信息，同时同时保留精细级别的信息，输入和输出我们的网络采用高斯金字塔的形式。

最后，作者以以下声明结束该段，与使用单个图像的其他方法相比，他们在论文中描述的方法使用了 3 张图像。

请注意，大多数其他从粗到精的网络都将单个图像作为输入和输出。

在作者对比的单一图像方法中，您不需要高斯金字塔。根据作者的说法，正如您将传递“单个图像作为输入和输出”一样。

回答你的第一个问题：

我想知道为什么网络设置为三层而不是其他数字，这在论文中似乎没有详细解释。

根据以上信息，作者指出他们使用 K=3 的方法与其他 K=1 的从粗到细的网络形成对比。他们没有明确解释为什么选择 3 而不是 4 或 5 的原因，但正如我提到的，他们谈论使用 K=3 金字塔来利用粗略、中等和精细级别的信息。这似乎表明应该至少有 K=3 来利用 3 个级别上可用的信息。

关于你的第二个问题：

我也搜索了高斯金字塔层数的影响，发现没有相关的帖子，所以我也很好奇高斯金字塔层数的影响以及如何合理设置层数.

这个问题是在征求回答者的意见——这不是 StackOverflow 的工作方式（请参阅此处以了解意见与事实政策）。我不能告诉你如何合理地设置这个数字。我可以告诉您，您可能需要考虑以下因素来帮助您做出决定：

为什么增加高斯金字塔的层数会影响性能？
通过向高斯金字塔添加额外的层可以获得哪些有用的额外信息？

如果你能回答这些问题，那应该可以帮助你决定是否值得追求 K=4、K=5 等

用于图像去模糊的多尺度卷积神经网络

问题描述投票：0回答：1

1个回答

最新问题

用于图像去模糊的多尺度卷积神经网络

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1