卷积神经网络中的旋转等方差?

问题描述 投票:0回答:2

我想知道CNN的基本架构是否具有旋转等方差性质?我只知道平移等方差,但不确定旋转。

根据我的搜索,旋转等方差可以通过旋转输入图像进行训练来实现。我真的需要这样做吗?旋转度数有多大?为了提供更多上下文,例如,我有一个 CNN,可以在横向模式下检测/读取文本。如果我将图像旋转 90 度/使其纵向,它会得到与原始图像相同的结果/执行相同的结果吗?

machine-learning computer-vision neural-network
2个回答
2
投票

您仅在某种程度上具有缩放和旋转不变性 - 究竟多少可能取决于您的设置。你拥有它是因为包含特征的池可能会重叠。

你的提议当然是可能的。您可以随时修改训练数据,添加噪声、旋转、不同比例等来实现该目标。但是,您的模型仍然不是完全旋转不变的。还可以修改网络本身以“正确”完成任务。我确信您在研究过程中偶然发现了Tiled CNNs(如果没有,您绝对应该阅读该论文)。他们使用 TICA 进行预训练,在过程中找到不变的特征。

关于 90° 旋转的最后一个问题:我建议您自己测试一下。如果发生旋转的情况已知(例如在移动设备上),我个人会看看手动将图片旋转回 0°(在将其提供给网络之前)对于给定的约束是否是一个令人满意的解决方案。这是最简单的方法。


0
投票

这些人的 CNN 被设计成具有旋转等方差,所以我想说普通 CNN 没有像翻译那样有那么多保证。 https://github.com/QUVA-Lab/e2cnn

© www.soinside.com 2019 - 2024. All rights reserved.