我在训练和conv2d操作期间追踪了gpu的使用情况,它显示:
conv2d
我试图用(3*3*3*16 + 32*450*450*3+ 32*448*448*16) * 4/(1024**2)计算这个操作的确切内存需求,等于466.16MB。显然,TensorFlow为Conv2d分配了318MB的内存。为什么TF会这样做?
(3*3*3*16 + 32*450*450*3+ 32*448*448*16) * 4/(1024**2)
Conv2d
conv2d的内部实现可能需要使用与输出大小无关的临时存储。