我刚刚在我的 Ubuntu 服务器上收到此消息:
Failed to initialize NVML: Driver/library version mismatch
打字时
watch nvidia-smi
我正在运行 ubuntu 服务器(Ubuntu 18.04.5 LTS),昨天一切正常。
那么问题来了,ubuntu服务器是不是在没有征得我许可的情况下自动更新了Nvidia驱动呢?我如何确认这一点?我不想自动更新!
我意识到重新启动可以解决这个问题,但这是服务器在做很多其他事情,所以不允许在周中重新启动:)
谢谢!
我也遇到了同样的问题。我通过执行以下操作解决了这个问题: 1> 使用命令检查 nvidia-driver 版本:
cat /proc/driver/nvidia/version
2> 检查驱动是否升级:cat /var/log/dpkg.log|grep nvidia
3>在我的电脑中,已经从415升级到418了。
4> 需要重新安装 nvidia-driver 并使用命令保持版本 apt-mark hold nvidia-415
我遇到了同样的问题,并通过安装正确的 GPU 驱动程序解决了它。
您需要安装cuda工具包和cudnn。详细请参考官方doc。驱动程序将自动安装。
注意:最新版本是12.1,可能与最新的torch不兼容,您必须自己构建它。
或者您需要安装11.x版本。