cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

CUDA 强制 OpenMP 以单线程模式运行

我写了一个CUDA SGEMM程序,当我想用多线程CPU实现来测试速度时,它无法以多线程方式运行。我单独隔离了 CPU 实现...

回答 1 投票 0

有没有办法在nvcc中为设备代码(内核代码)启用`-Wconversion`?

我最近正在学习用CUDA编写前缀和算法。我有一个愚蠢的错误,我将浮点变量分配给失去精度的整数变量: // 第 3 阶段:填充最后一个元素 o

回答 1 投票 0

为什么编译 CUDA C++ 项目时 nvcc 不起作用而 cmake 起作用?

我有一个用 CUDA C++ 编写的代码,我可以使用 CMake、Make 构建这个项目并像往常一样运行它。但是当我尝试使用 nvcc 来调试它时,它会抛出类似的错误 致命错误:ATen/ATen.h:没有这样的...

回答 1 投票 0

使用 OpenMP 支持编译和链接 CUDA 源文件

是否可以在 CUDA 源文件(而不是内核代码)中使用 OpenMP 编译指示? 我将结合 GPU 和 CPU 计算。但 nvcc 编译器失败,并显示“找不到未知选项‘openmp’&qu...

回答 4 投票 0

在cuda主机代码中使用openMP?

是否可以在 CUDA 文件中使用 openMP 编译指示(而不是在内核代码中)? 我将结合 GPU 和 CPU 计算。但是 nvvc 编译器失败,并显示“找不到未知选项‘openmp’”,如果我是

回答 4 投票 0

当 cufftPlanMany

还有其他原因导致CUFFT_INTERNAL_ERROR发生吗? 我对每组相同大小的输入和不同批量大小进行 cuFFT2D。 输入数组大小为 360(行)x90(列),批量大小通常...

回答 1 投票 0

如何使用软件实现在没有 GPU 的情况下运行 CUDA?

我的笔记本电脑没有 nVidia 显卡,我想在 CUDA 上工作。该网站称 CUDA 也可以在非 cuda 硬件上以仿真模式使用。但是当我尝试安装 CUDA 驱动程序时

回答 5 投票 0

我应该如何让 CMake 为我的内核创建 PTX 文件

我正在使用 CUDA 代码构建一个项目,使用最近的 CMake,它具有内在的 CUDA 支持(版本 >= 3.8 或更高版本,如果需要)。 我如何告诉 CMake(也)为我的各种

回答 3 投票 0

在 Docker 容器中使用 Python 版本 3.11 安装 PyTorch

我在PyTorch官方页面上看到PyTorch支持Python版本3.8到3.11。 当我实际尝试在 Python 3.11 Docker 映像中安装 PyTorch + CUDA 时,似乎无法找到 CUDA 驱动器...

回答 1 投票 0

python distutils可以编译CUDA代码吗?

我有 CUDA 代码,我想使用 distutils 为 Python 构建动态库。但即使安装了“nvcc”编译器,distutils 似乎也无法识别“.cu”文件。不知道如何获得...

回答 2 投票 0

PTX (8.4) 不涵盖较小形状的 WMMA 指令吗?

我想使用 SASS 指令,从 CUDA 12.4 开始,该指令无法通过 PTX 指令使用(AFAICT)。也就是说,假设它是: HMMA.16816.F16 - 半精度的扭曲宽度矩阵乘法加法...

回答 1 投票 0

PTX (8.3) 不涵盖较小形状的 WMMA 指令吗?

我想使用 SASS 指令,但 (AFAICT) 无法通过 PTX 指令使用。即,假设它是: HMMA.16816.F16 - 半精度数据的扭曲宽度矩阵乘法加法,具有 sha...

回答 1 投票 0

CUDA 汇编指令

反汇编 CUDA 代码似乎是一种非常有用的工具,即使在某些情况下不是唯一的工具,也可以用来了解编译器的行为以及性能指标。 我会说不幸的是......

回答 1 投票 0

是否有相当于 std::numeric_limits 的 CUDA?

我想确定 CUDA 内核中的最大 int 值。不幸的是我找不到任何类似于 CUDA 的 std::numeric_limits 的东西。尝试使用 ::std 函数会导致错误: ...

回答 3 投票 0

CUDA 内核,用于查找一维数组中大于特定阈值的最小和最大索引值

我正在尝试编写一个 CUDA 内核,用于查找一维数组中大于特定阈值的最小和最大索引值 下面是 CPU 中执行相同操作的伪代码 int min_index ...

回答 1 投票 0

共享内存访问 CUDA 中的垃圾值

我正在尝试使用 CUDA 实现 2D Navier-Stokes 求解器。我正在使用雅可比方法来求解差分方程组。我将代码分成 4x4 块,由 16x16 组成......

回答 1 投票 0

VS2022“无法加载文件或程序集”Emgu.CV,版本=4.7.0..定位的程序集的清单定义与程序集引用不匹配

在将 EmguCV 4.7.0 库文件替换为 4.6.0 后,我在 C# Windows 窗体应用程序中运行时遇到此错误。我降级是因为 4.7.0 还不支持 CUDA。 我做到了...

回答 1 投票 0

atomicAdd() 显示错误:没有重载函数“atomicAdd”的实例对参数列表进行数学计算

所以,我必须使用 CUDA 的共享内存来分析这个矩阵向量乘法,但是,我在 Visual Studio 2022 上执行代码时遇到问题,我收到错误“no insta...

回答 1 投票 0

所有 IEE754 类型的 CUDA 中的 std::floating_point 概念

我想知道 CUDA 是否提供了类似于 std::floating_point 的概念,但包括所有 IEE754 类型,例如__一半。我在下面提供了一个示例代码来测试 __half 模板的乐趣...

回答 1 投票 0

cuda 中自定义结构的内存分配

我有这些结构: typedef 结构边缘 { 开始; 打算; } 边缘; 类型定义结构{ 整数度; int 名称; 边缘*边缘; 顶点; 在我的主要功能中,我有一个初始

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.