我尝试在Google Colab中对TPU和CPU进行培训。我希望该模型在没有任何问题的情况下进行培训,包括NAN值损失或准确性,尤其是因为培训在CPU上效果很好。但是,当使用TPU时,我遇到了NAN值的准确性和损失。我还验证了数据很干净,没有NAN,无穷大或失衡问题,并确保模型汇编和培训设置正确。
您可以参考以下URL
https://github.com/tensorflow/tensorflow/issues/86953#Event-16275455512
这似乎是keras
的问题
我使用此方法在之前解决它
您可以尝试一下