我有以下问题:当我重新训练我自己的数据集TF对象检测API,培训往往是死亡,我不知道原因。没有错误日志,刚刚杀了。此外,为什么在我的MODEL_DIR
只有少数model.ckpt-XXXX
保存?
其次,当我尝试上述模型导出到一个冷冻图形与提供的脚本,我在分析中看到有是不完整的形状:
================== Model Analysis Report ======================
Incomplete shape.
我用了一个model.cpkt-XXXX
训练过程中被杀害之后,是为什么形状是不完整的原因吗?
导出的模型可以使用的推理,但我想这是不是最佳的...
仅供参考,我已重新训练了mobileSSDv2与1类和我已经修改了关于修改如下管道配置文件:
config {}
部分,我改变批量大小到12,并把步骤的数量,以200train_input_reader
和eval_input_reader {}
部分,我已经加入我的路径的TF记录和labelmap.pbtxt
eval_config {}
部分,我已经改变示例的数量85(图像的在我的eval图像存储库号)和max EVAL至5。我使用Ubuntu 16.04与tensoflow-GPU 1.12.0在virtualenv中与Python 2.7。
先感谢您。
如果您正在使用tensorflow-GPU和你有一个GPU,200是一个非常低的数字,你在更短的几分钟内(和您的CONV网将学习什么)到达。它增加100.000,至少。
此外,由于低数量的训练步骤,你可能期望在启动(步骤0)和结束训练(步骤200)培训保存模型,所以你只有2款。
Tensorflow保存车型每600秒,如果你不改变里面trainer.py save_interval_secs