我正在开发一个使用 Keras 深度学习模型的项目,我需要将其转移到 PyTorch 中。 该项目的目标是本地化图像上的一些元素。为了训练它,我首先使用从图像中提取的补丁,然后推断完整图像。我读到 Keras 输入层的
(None,None,1)
输入形状是可能的,并且它目前正在工作。然而,同样的训练系统似乎在 Pytorch 中不起作用。因此,我想知道当我开始推断完整图像时,(None,None,1)
输入层是否在做一些特定的事情?
正如链接中的讨论并引用
fchollet
的话:
当然, 并不总是可能有这样的自由维度(例如它是 TensorFlow 不可能有可变长度序列,但它是 与 Theano)。
可以认为这是因为框架的架构。正如您所说,它可能在 keras 中被接受,但在 PyTorch 中不被接受。