我怎么知道是否安装了NCCL?

问题描述 投票:0回答:1
非常简单的问题。我可以访问多节点计算机,必须进行一些

NCCL测试。 在读书中说

如果CUDA未安装在/usr/local/cuda中,则可以指定 cuda_home。同样,如果未在 /usr中安装NCCL,则可以 指定nccl_home.

我可以看到CUDA已安装,但(这是我的问题)

如何知道是否安装了NCCL?在哪里?


其他信息 我做了

find /usr -name "libnccl.so*" 2>/dev/null

我找到了这个文件。但是当我呆滞时
find /usr -name "nccl.h" 2>/dev/null
没有找到它。 显然我甚至无法建立最简单的

#include <stdio.h> #include <nccl.h> int main() { printf("NCCL version: %d\n", NCCL_VERSION_CODE); return 0; }
(顺便说一句,我认为操作系统是Centos)

您可能有运行时:

sudo yum install -y libnccl
nvidia hpc nccl
1个回答
0
投票
但不是开发环境:

sudo yum install -y libnccl-devel
作为替代方案,由于您具有HPC标签,因此大多数HPC群集倾向于在模块(env mod或lmod)下具有其代码,并且通常在外部 /usr。你可以和

一起看

module avail nccl
如果在那里,您可以加载模块并应访问开发环境。
    

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.