例如,如何使用Pycharm调试需要使用以下终端脚本运行的文件train.py
python -m torch.distributed.launch --nproc_per_node=2 train.py --param1 --param2
这可能是pycharm中最接近的内容:https://www.jetbrains.com/help/pycharm/attaching-to-local-process.html,但没有那么有用。
考虑使用pytorch挂钩。例如,请参见此处:https://www.google.com/amp/s/blog.paperspace.com/pytorch-hooks-gradient-clipping-debugging/amp/