一直在尝试按照Google教程使用ML Engine for TensorFlow。因错误而被称为“运行本地培训工作”的地方已经卡住了
/usr/bin/python: No module named trainer
完整命令是:
gcloud ml-engine local train \
--module-name trainer.task \
--package-path trainer/ \
--job-dir $MODEL_DIR \
-- \
--train-files $TRAIN_DATA \
--eval-files $EVAL_DATA \
--train-steps 1000 \
--eval-steps 100
根据我的知识,这三个变量都是正确设置的,尽管现在还没有找到它们。本教程未指定下载培训师文件或如何引用它,过去一小时的谷歌搜索没有找到任何有效的解决方案。找到了这个一般性的解释:
--module-name使用包的命名空间点表示法指定应用程序主模块的名称。这是您运行以启动应用程序的Python文件。例如,如果您的主模块是... / my_application / trainer / task.py(参见推荐的项目结构),那么模块名称是trainer.task
任何信息,将不胜感激。
感谢达斯汀提供的信息,评论中找到了解决方案。
只是下载Cloud Shell上的培训师目录而不是我的本地环境。
现在文件结构看起来像:
estimator
|-- data
| |-- adult_data.csv
| |-- adult_test.csv
|-- output
|-- trainer
| |-- __init__.py
| |-- model.py
| |-- task.ipynb
| |-- task.py