隐藏的三维卷积网络层的形状,如何计算?

问题描述 投票:1回答:1

我想用计算机计算一个CNN给定的隐藏层输出的形状,所以假设输入形状是(27,27,27,1)即一个图像channe,第一个卷积层是一个16X(3,3,3)的核,stride是1,padding是0,所以这一层的输出形状是 。(25,25,25,16),16对应于这一层的核数,所以这里我们有16个形状为(25,25,25)的卷积层,之后,我们有第二个卷积层是32X(3,3,3)的核,跨度为1,padding为0,所以这一层的每个核都应该(通常)应用于这一层的整个输入卷。 所以我不明白我们是如何得到(23,23,23,32)的,而第一层(即16)的输出的第四维在哪里?

machine-learning multidimensional-array deep-learning computer-vision conv-neural-network
1个回答
1
投票

只考虑第二层(忽略偏置)

  • 输入形状。(25, 25, 25, 16)
  • 核心大小。(3, 3, 3)
  • 输出通道。32
  • 总的权数。16 * 32 * 3 * 3 * 3

与2D conv层实际上是在执行多个3D卷积的方式类似,3D conv层实际上是在执行多个4D卷积。具体来说,所述的3D conv层是在执行32个卷积,每个卷积的核大小为(3,3,3,16)。这些卷积操作之一对输入特征的结果是(23,23,23,1)。在所有32个这样的操作完成后,它们沿着通道维度进行堆叠,导致最终的输出形状为(23,23,23,32)。

© www.soinside.com 2019 - 2024. All rights reserved.