我想用计算机计算一个CNN给定的隐藏层输出的形状,所以假设输入形状是(27,27,27,1)即一个图像channe,第一个卷积层是一个16X(3,3,3)的核,stride是1,padding是0,所以这一层的输出形状是 。(25,25,25,16),16对应于这一层的核数,所以这里我们有16个形状为(25,25,25)的卷积层,之后,我们有第二个卷积层是32X(3,3,3)的核,跨度为1,padding为0,所以这一层的每个核都应该(通常)应用于这一层的整个输入卷。 所以我不明白我们是如何得到(23,23,23,32)的,而第一层(即16)的输出的第四维在哪里?
只考虑第二层(忽略偏置)
与2D conv层实际上是在执行多个3D卷积的方式类似,3D conv层实际上是在执行多个4D卷积。具体来说,所述的3D conv层是在执行32个卷积,每个卷积的核大小为(3,3,3,16)。这些卷积操作之一对输入特征的结果是(23,23,23,1)。在所有32个这样的操作完成后,它们沿着通道维度进行堆叠,导致最终的输出形状为(23,23,23,32)。