nvidia 相关问题

一家美国全球科技公司,总部位于加利福尼亚州圣克拉拉,以其图形处理器(GPU)而闻名。

许多 CUDA 示例失败了

安装新的 CUDA 4.0 驱动程序和 SDK 后,许多 SDK 测试失败(例如 fastWalshTransform、matrixMul、reduction)。这是./deviceQuery: 设备 0:“GeForce GTX 570” CUDA 驱动程序版本 /

回答 2 投票 0

将 NVIDIA GPUDirect RDMA 与 nvJPEG 结合使用

是否可以将 NVIDIA GPIDirect RDMA 与 NVIDIA nvJPEG 结合使用? 从 RDMA 技术的描述来看,这应该是可能的,但 nvJPEG 接口似乎只需要主机内存输入。

回答 3 投票 0

如何查看NCCL版本

我远程访问高性能计算节点。我不确定 NVIDIA Collective Communications Library (NCCL) 是否安装在我的目录中。有什么办法可以检查NC是否...

回答 3 投票 0

如何安装Nsight DL design

我寻求有关在 Linux 上使用 Nsight DL Designer 的指导。尽管成功下载了该应用程序,但我在执行它时遇到了困难。下载提供的...

回答 1 投票 0

Valgrind:libnvidia-glcore.so.346.47 条件跳转或移动取决于未初始化的值

当针对链接到 NVIDIA 的 libGL.so 的动态库运行我的测试 C++ 应用程序时,我收到 Valgrind 报告的以下错误(见下文)。我很想压制他们,但是......

回答 2 投票 0

无法检测 NVIDIA GPU 的 OpenCL 3.0

cmake 检测 OpenCL 时遇到奇怪的问题。 当我使用以下 CMakeLists.txt 时: cmake_minimum_required(版本3.10) # 取消注释使其正常工作 # 包括(检查符号是否存在) #

回答 1 投票 0

为什么 RTX 3090 训练时比 RTX 2080 Ti 慢很多?

[环境] CUDA:11.8 火炬:2.3.1 机器1配置: CPU:Intel(R) Core(TM) i7-9800X CPU @3.80GHz 显卡:RTX 2080Ti 内存:16GB 机器2配置 CPU:Intel(R) Xeon(R) Gold 6138 CPU @ 2.

回答 1 投票 0

使用 NVAPI SDK 检索全局配置文件设置(显示在 Nvidia 控制面板中)时出现问题

我想使用 NVIDIA 的 NVAPI SDK 检索 NVIDIA 控制面板的 3D 设置的全局配置文件中公开的所有设置。 参考文档在这里:NVAPI驱动程序设置(DRS)AP...

回答 3 投票 0

OpenMP 5 使用成员函数和数据指针卸载 C++ 结构

我在过去的许多项目中都使用过 OpenMP。另外,我还在一些开源项目中编写了 CUDA 和 OpenCL GPU 代码。 我经常听说 OpenMP 5 添加了对 NV 的支持...

回答 1 投票 0

使用 cudf 进行多线程

我想在 GPU 上生成多个线程。就像我附加的代码片段一样。这样做会引发错误 MemoryError: std::bad_alloc: CUDA error at: rapids/include/rmm/mr/device/

回答 1 投票 0

带有 CUDA 后端的自定义向量类

我一直在自学CUDA,我想做的一个项目是实现一个线性代数库。我用 C++ 创建了一个数学向量类,它通过 GPU 计算点积......

回答 1 投票 0

块中CUDA线程之间的距离有影响吗?

我有一个关于GPU编程的幼稚问题。 (ChatGPT 和 Claude 并没有真正给我一个令人信服的答案。也许我提示得不好。) GPU 编程语言(如 CUDA 和 OpenCL)组织了...

回答 1 投票 0

Windows 降低了我的显示器的分辨率

我不确定这是问这个问题的正确地方,但我真的很绝望。 最近,当我将 HDMI 电缆连接到外接显示器时,我的 Windows 遇到了这种奇怪的问题,

回答 1 投票 0

pytorch 2.5.1 nvidia 驱动程序 560.35.03 在 Debian 12 上不兼容问题

我在 Debian 12 机器上搞砸了驱动程序安装,曾经能够运行 Ollama 和 ComfyUI,但出现 python 错误: 用户警告:CUDA 初始化:CUDA 未知错误 - 这可能是由于

回答 1 投票 0

为什么运行 Llama 3.1 70B 模型时 GPU 利用率不足?

我已在我的系统上部署了 Llama 3.1 70B 和 Llama 3.1 8B,它非常适合 8B 型号。当我测试 70B 时,它没有充分利用 GPU,并且需要很长时间才能响应。这是

回答 1 投票 0

Anylogic 和 NVidia Omniverse 渲染

我正在尝试将我的 Anylogic 模型连接到 Omniverse,但是当我在“渲染模型”中添加路径和文件名后,“完成”按钮未启用,因此我无法渲染。做...

回答 1 投票 0

在数据中心节点找不到GPU设备

我刚开始寻找多节点数据中心的方法。下面的事情正在发生在我身上。 首先,我使用此答案中的程序来检查 CUDA 设备。我构建了它(我遇到了一些问题...

回答 1 投票 0

Ubuntu24.04 cudaGetDevice 失败

我的程序是这样的: #包括 int main() { 整数 ID = -1; cudaGetDevice(&id); if (id != cudaSuccess) std::cout << "Failed!"; return 0; } My o...

回答 1 投票 0

运行时错误:r.nvmlDeviceGetNvLinkRemoteDeviceType_内部断言失败于

我正在编写一个Python代码,用于训练分类器对样本进行分类(每个样本10个句子)。我正在使用具有附加层的 Sentence_Transformer 并在 Linux 上运行模型训练...

回答 1 投票 0

分配可执行内存并在CUDA中执行

我想在CUDA中分配可执行内存,在那里编写SASS/CUBIN代码,然后执行该代码。 在 Linux 系统的 CPU 上,这非常简单并且有详细的文档记录——只需

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.