CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。
尝试使用compute-sanitizer时无法找到注入库libsanitizer-collection.so
compute-sanitizer --tool memcheck my_cuda_program 是我正在尝试做的事情。 我正在尝试这个,因为我得到了 线程 1 my_cuda_program 收到信号 CUDA_EXCEPTION_5,Warp 超出范围地址。什...
使用 sm_21 编译时出现 CUDA 4.2 nvcc (cicc) 错误
我有一个奇怪的问题!我有一张 GTX 560 Ti 卡(计算能力 2.1),用于开发 CUDA 应用程序。 现在经过数百次编译后,我得到了一个错误。也就是编译阶段...
CUDA.rules 文件的命令行是: echo [编译器路径] [保留] [CInterleavedPTX] [ExtraNvccOptions] [拱门] -ccbin “$(VCInstallDir)bin” [仿真] [FastMath] [定义] -Xcompiler &qu...
我使用的是 Fedora 40,并使用以下命令安装了 CUDA 工具包: sudo dnf config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/fedora39/x86_64/cuda-fedora39.repo...
为什么 `(x / y)[i]` 比 `x[i] / y[i]` 快?
我是 CuPy 和 CUDA/GPU 计算的新手。有人可以解释为什么 (x / y)[i] 比 x[i] / y[i] 快吗? 当利用 GPU 加速计算时,是否有任何指南可以...
我尝试了这种方法来从服务器创建 Docker 映像。该服务器具有 Nvidia 3070 GPU,并运行这样的 AI 模型。该方法使用 Dockerfile 通过 COPY //e... 来复制整个系统
我可以使用其损坏的符号名称获取指向 CUDA 内核的设备端指针吗?
注意:如果文章看起来很长,可以直接跳到最后以“我想知道..”开头的部分,以防有人想跳过构建/上下文。 构建/上下文: 为了...
我有一个模板函数,其中模板参数是整数。该整数用于创建不同的内核。以前,所有可能的模板都是在表格中手动实例化的......
在 CUDA 中使用事件时,我通常创建一个事件并立即将其记录在某个流上。同步后,我懒得保留那个 cudaEvent_t,在其他地方使用它 - 我只是...
我对 CUDA 编程指南 4.0 第 5.3.2.1 节中的以下陈述感到困惑 在绩效指南一章中。 全局内存驻留在设备内存中,设备内存是
我有一个cuda程序,其中每个线程必须对一个小数组(N = 49)进行排序。目前我正在使用 GeeksforGeeks 的简单堆排序算法,如下所示: __global__ 无效内核(int N){ ... d...
我需要知道 scandit 是否支持 CUDA 或其他 Gpu 支持,以便我可以利用 GPU 而不是 CPU 来使用我的应用程序。 我也搜索过官方文档,但我...
Docker nvidia/cuda/pytorch 容器在 Dockerfile 中找不到 GPU
我正在尝试使用Pytorch和nvidia/cuda设置开发环境,但它不起作用。 以下命令按预期工作并识别 GPU: docker run --gpus all -it --rm nvcr...
如何在没有 GPU 的情况下运行使用 torch.ones([1], device=torch.device("cuda")) 的代码?
目标: 在 MacBook Pro M2 中开发 PyTorch 模型 问题: 一些CVPR论文使用“device”参数并将其设置为“cuda”。 所以,如果源代码不修改,它总是
Cuda C++ 从内核中的设备全局内存访问结构会导致非法内存访问
我正在使用 Nvidia Cuda 工具包开发一个更大的程序,但不断收到非法内存访问错误。我最终将问题定位到我对结构的访问,但是,据我所知......
如何使用 llm 对象通过单个脚本使用 vLLM 在多个 GPU 上加载多个模型?
我尝试使用 vLLM 在单个 Python 脚本中将相同的模型加载到不同的 GPU 上,但在初始化第二个模型时遇到错误。 我正在尝试做的事情: 环境...
“编译CUDA编译器识别源文件...失败”时的错误日志在哪里?
(这个问题的衍生) 假设我尝试配置一个使用 CUDA 的项目,即调用 启用语言(CUDA) 在 CMakeLists.txt 中,在配置时,我被告知: ...等等等等... CMake
我使用以下命令在 Ubuntu 22.04 中安装了 CUDA Toolkit 12.6 Update 1(说明可在此处找到): wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-
如何在VS2010或VS2008下编译CUDA Toolkit 4.0 RC2程序?
我是一个完整的 CUDA 初学者,我正在尝试弄清楚如何使用 Visual Studio 编写和编译测试 CUDA 程序。 我安装了 CUDA 4 工具包以及 2008 和 2010 版本的
如何在同一个 Visual Studio 项目中编译 CUDA C 文件和 Nvidia OptiX 文件
我目前正在 Visual Studio 上使用 Optix 光线追踪引擎。我的问题包括计算数据并使用 Optix 渲染它们。 我已经编写了一个纯 C CUDA 程序来计算...