一家美国全球科技公司,总部位于加利福尼亚州圣克拉拉,以其图形处理器(GPU)而闻名。
我远程访问高性能计算节点。我不确定 NVIDIA Collective Communications Library (NCCL) 是否安装在我的目录中。有什么办法可以检查NC是否...
我寻求有关在 Linux 上使用 Nsight DL Designer 的指导。尽管成功下载了该应用程序,但我在执行它时遇到了困难。下载提供的...
Valgrind:libnvidia-glcore.so.346.47 条件跳转或移动取决于未初始化的值
当针对链接到 NVIDIA 的 libGL.so 的动态库运行我的测试 C++ 应用程序时,我收到 Valgrind 报告的以下错误(见下文)。我很想压制他们,但是......
cmake 检测 OpenCL 时遇到奇怪的问题。 当我使用以下 CMakeLists.txt 时: cmake_minimum_required(版本3.10) # 取消注释使其正常工作 # 包括(检查符号是否存在) #
为什么 RTX 3090 训练时比 RTX 2080 Ti 慢很多?
[环境] CUDA:11.8 火炬:2.3.1 机器1配置: CPU:Intel(R) Core(TM) i7-9800X CPU @3.80GHz 显卡:RTX 2080Ti 内存:16GB 机器2配置 CPU:Intel(R) Xeon(R) Gold 6138 CPU @ 2.
使用 NVAPI SDK 检索全局配置文件设置(显示在 Nvidia 控制面板中)时出现问题
我想使用 NVIDIA 的 NVAPI SDK 检索 NVIDIA 控制面板的 3D 设置的全局配置文件中公开的所有设置。 参考文档在这里:NVAPI驱动程序设置(DRS)AP...
我在过去的许多项目中都使用过 OpenMP。另外,我还在一些开源项目中编写了 CUDA 和 OpenCL GPU 代码。 我经常听说 OpenMP 5 添加了对 NV 的支持...
我想在 GPU 上生成多个线程。就像我附加的代码片段一样。这样做会引发错误 MemoryError: std::bad_alloc: CUDA error at: rapids/include/rmm/mr/device/
我一直在自学CUDA,我想做的一个项目是实现一个线性代数库。我用 C++ 创建了一个数学向量类,它通过 GPU 计算点积......
我有一个关于GPU编程的幼稚问题。 (ChatGPT 和 Claude 并没有真正给我一个令人信服的答案。也许我提示得不好。) GPU 编程语言(如 CUDA 和 OpenCL)组织了...
我不确定这是问这个问题的正确地方,但我真的很绝望。 最近,当我将 HDMI 电缆连接到外接显示器时,我的 Windows 遇到了这种奇怪的问题,
pytorch 2.5.1 nvidia 驱动程序 560.35.03 在 Debian 12 上不兼容问题
我在 Debian 12 机器上搞砸了驱动程序安装,曾经能够运行 Ollama 和 ComfyUI,但出现 python 错误: 用户警告:CUDA 初始化:CUDA 未知错误 - 这可能是由于
为什么运行 Llama 3.1 70B 模型时 GPU 利用率不足?
我已在我的系统上部署了 Llama 3.1 70B 和 Llama 3.1 8B,它非常适合 8B 型号。当我测试 70B 时,它没有充分利用 GPU,并且需要很长时间才能响应。这是
Anylogic 和 NVidia Omniverse 渲染
我正在尝试将我的 Anylogic 模型连接到 Omniverse,但是当我在“渲染模型”中添加路径和文件名后,“完成”按钮未启用,因此我无法渲染。做...
我刚开始寻找多节点数据中心的方法。下面的事情正在发生在我身上。 首先,我使用此答案中的程序来检查 CUDA 设备。我构建了它(我遇到了一些问题...
我的程序是这样的: #包括 int main() { 整数 ID = -1; cudaGetDevice(&id); if (id != cudaSuccess) std::cout << "Failed!"; return 0; } My o...
运行时错误:r.nvmlDeviceGetNvLinkRemoteDeviceType_内部断言失败于
我正在编写一个Python代码,用于训练分类器对样本进行分类(每个样本10个句子)。我正在使用具有附加层的 Sentence_Transformer 并在 Linux 上运行模型训练...
我想在CUDA中分配可执行内存,在那里编写SASS/CUBIN代码,然后执行该代码。 在 Linux 系统的 CPU 上,这非常简单并且有详细的文档记录——只需
获取 ud_ep.c:278 致命:UD 端点 0x22fe520 到 <no debug data>:尝试使用 OpenMPI 和 UCX 进行 OSU 微基准测试时出现未处理的超时错误
我有几台带有一些网卡的服务器,我安装了 ompi、ucx 和 osu-microbenchmarks。我正在运行以下命令, mpirun --mca pml ucx --mca osc ucx --mca spml ucx --mca btl ^
将 Autogen 与 Nvidia NIM 上的 Llama 模型集成
我正在尝试为我的代理使用 Nividia“https://integrate.api.nvidia.com/v1”上的“meta/llama-3.1-8b-instruct”。 导入自动生成器 配置列表 = [ { “模型...