NCCL测试。 在读书中说
如果CUDA未安装在/usr/local/cuda中,则可以指定 cuda_home。同样,如果未在 /usr中安装NCCL,则可以 指定nccl_home.我可以看到CUDA已安装,但(这是我的问题)
如何知道是否安装了NCCL?在哪里?
find /usr -name "libnccl.so*" 2>/dev/null
我找到了这个文件。但是当我呆滞时
find /usr -name "nccl.h" 2>/dev/null
没有找到它。 显然我甚至无法建立最简单的
#include <stdio.h>
#include <nccl.h>
int main() {
printf("NCCL version: %d\n", NCCL_VERSION_CODE);
return 0;
}
(顺便说一句,我认为操作系统是Centos)您可能有运行时:
sudo yum install -y libnccl
sudo yum install -y libnccl-devel
作为替代方案,由于您具有HPC标签,因此大多数HPC群集倾向于在模块(env mod或lmod)下具有其代码,并且通常在外部 /usr。你可以和一起看
module avail nccl
如果在那里,您可以加载模块并应访问开发环境。