我试图跨越渠道维度,以下代码表现出令人惊讶的行为。我希望tf.nn.max_pool
和tf.nn.avg_pool
在输入完全相同的参数时应该产生相同形状的张量。不是这种情况。
import tensorflow as tf
x = tf.get_variable('x', shape=(100, 32, 32, 64),
initializer=tf.constant_initializer(5), dtype=tf.float32)
ksize = (1, 2, 2, 2)
strides = (1, 2, 2, 2)
max_pool = tf.nn.max_pool(x, ksize, strides, padding='SAME')
avg_pool = tf.nn.avg_pool(x, ksize, strides, padding='SAME')
print(max_pool.shape)
print(avg_pool.shape)
这打印
$ python ex04/mini.py
(100, 16, 16, 32)
(100, 16, 16, 64)
显然,我误解了一些事情。
链接https://github.com/Hvass-Labs/TensorFlow-Tutorials/issues/19说:
第一步和最后一步必须始终为1,因为第一步是图像编号,最后一步是输入通道。