我正在尝试构建一个可以使用 GPU 运行的 docker 映像,这是我的情况:
我有 python 3.6,我从图像 nvidia/cuda:10.0-cudnn7-devel 开始。 Torch 没有看到我的 GPU。
nvidia-smi
也不起作用,返回错误:
> Failed to initialize NVML: Unknown Error
> The command '/bin/sh -c nvidia-smi' returned a non-zero code: 255
我安装了 nvidia 工具包和 nvidia-smi
RUN apt install nvidia-cuda-toolkit -y
RUN apt-get install nvidia-utils-410 -y
我发现问题是你不能在构建过程中使用 nvidia-smi (RUN nvidia-smi)。构建过程中与 GPU 可用性相关的任何检查都将不起作用。
使用CMD bin/bash并输入命令
python3 -c 'import torch; print(torch.cuda.is_available())'
,我终于得到了True。
我也删了
RUN apt install nvidia-cuda-toolkit -y
RUN apt-get install nvidia-utils-410 -y
根据@RobertCrovella 的建议