NvidiaGpuDriverLinux 无法在 NC6 实例上安装

问题描述 投票:0回答:2

和标题差不多。该虚拟机是运行 Linux (ubuntu 20.04) 的“标准 NC6s v3”,支持 NVIDIA Tesla V100。我在配置这台机器时添加了 NVIDIA GPU 驱动程序扩展。

实际部署陷入“Transitioning”状态

enter image description here

我能够连接到虚拟机,并且可以确认后台 apt-get 任务正在运行:

> ps -aux | grep 2736
0:01 apt-get -o Dpkg::Options::=--force-overwrite --no-install-recommends install -y cuda-drivers
0:00 /usr/bin/perl -w /usr/share/debconf/frontend /usr/lib/dkms/common.postinst nvidia 530.30.02 /usr/share/nvidia x86_64

已经40多分钟了。这需要多长时间才能完成(如果能够完成的话)?

azure virtual-machine nvidia ubuntu-20.04 tesla
2个回答
1
投票

NvidiaGpuDriverLinux 扩展陷入过渡状态的问题似乎是间歇性。我尝试在我的环境中配置具有相同扩展名和配置的 Linux 虚拟机。第一次尝试失败了,但是当我使用相同的配置再次尝试时,它成功了。

已经40多分钟了。这需要多长时间才能完成(如果能够完成的话)?

部署通常需要10-15分钟,有时长达30分钟。但是,如果扩展处于过渡状态超过 30 分钟,则扩展的部署可能失败。

您可以尝试按照以下步骤在虚拟机中的“扩展 + 应用程序”选项卡中重新部署扩展或创建一个新虚拟机。

delete the failed extension

install the extension again

enter image description here

参考资料: 适用于 Linux 的 NVIDIA GPU 驱动程序扩展 |微软文档


0
投票

我的回答确实很晚,但这可能会对将来的某人有所帮助。我相当确定您选择的 GPU VM 使用 AMD GPU。 NVIDIA GPU 驱动程序扩展仅支持使用 NVIDIA GPU 的 NC4as_T4 及更高版本的虚拟机

© www.soinside.com 2019 - 2024. All rights reserved.