cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

当编译器未提供 uint8_t 时,什么是更好的替代方案?

我正在使用 nvcc 编译 CUDA 内核。不幸的是,nvcc 似乎不支持 uint8_t,尽管它确实支持 int8_t(!)。为了可移植性、可读性,我宁愿不使用 unsigned char...

回答 4 投票 0

如何将 GPUDirect RDMA 与 Infiniband 结合使用

我有两台机器。每台机器上都有多张 Tesla 卡。每台机器上还有一张 InfiniBand 卡。我想通过InfiniBa在不同机器上的GPU卡之间进行通信...

回答 1 投票 0

Makefile 变量替换有时会被忽略

编译一个支持 CUDA 的 Aircrack-ng 版本,该版本已经有一段时间没有修复错误了,所以需要一些修补才能完成大部分工作。 基本上make找不到相关的编译...

回答 2 投票 0

在 WSL 中启用 NVIDIA GPU

我正在尝试让我的 GPU 在我的 WSL 环境和我的 Docker 容器中可用。我已遵循 Microsoft/NVIDIA 指南,但似乎不起作用。没有明显的错误,但是......

回答 1 投票 0

具有动态分配共享内存的Cupy

考虑通过此链接中的 CUPY 在 python 中使用的以下 CUDA 内核 add_kernel = cp.RawKernel(r''' 外部“C”__global__ void my_add(const float* x1, const float* x2, float*...

回答 1 投票 0

Numba cuda.jit 和 njit 给出不同的结果

在下面的例子中,我有一个简单的CPU函数: 将 numpy 导入为 np 从 numba 导入 njit、cuda @njit def cpu_func(a, b, c, d): 对于范围内的 i(len(a)): 对于 l 在范围内(d[i], 0, ...

回答 1 投票 0

使用或不使用选项 -g -G 编译 CUDA 程序有什么区别

我有一个 CUDA 程序。如果我使用 -g -G 选项编译该程序,我可以获得正确的输出。如果我在没有 -g -G 选项的情况下编译它,我并不总是得到正确的输出。我的猜测是没有...

回答 1 投票 0

尝试使用compute-sanitizer时无法找到注入库libsanitizer-collection.so

compute-sanitizer --tool memcheck my_cuda_program 是我正在尝试做的事情。 我正在尝试这个,因为我得到了 线程 1 my_cuda_program 收到信号 CUDA_EXCEPTION_5,Warp 超出范围地址。什...

回答 1 投票 0

使用 sm_21 编译时出现 CUDA 4.2 nvcc (cicc) 错误

我有一个奇怪的问题!我有一张 GTX 560 Ti 卡(计算能力 2.1),用于开发 CUDA 应用程序。 现在经过数百次编译后,我得到了一个错误。也就是编译阶段...

回答 1 投票 0

为什么CUDA.rules有两个相同的命令行

CUDA.rules 文件的命令行是: echo [编译器路径] [保留] [CInterleavedPTX] [ExtraNvccOptions] [拱门] -ccbin “$(VCInstallDir)bin” [仿真] [FastMath] [定义] -Xcompiler &qu...

回答 2 投票 0

Linux 上的 CMake 找不到 CUDA

我使用的是 Fedora 40,并使用以下命令安装了 CUDA 工具包: sudo dnf config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/fedora39/x86_64/cuda-fedora39.repo...

回答 1 投票 0

为什么 `(x / y)[i]` 比 `x[i] / y[i]` 快?

我是 CuPy 和 CUDA/GPU 计算的新手。有人可以解释为什么 (x / y)[i] 比 x[i] / y[i] 快吗? 当利用 GPU 加速计算时,是否有任何指南可以...

回答 1 投票 0

创建一个 Docker 镜像,包括所有必要的工具和依赖项

我尝试了这种方法来从服务器创建 Docker 映像。该服务器具有 Nvidia 3070 GPU,并运行这样的 AI 模型。该方法使用 Dockerfile 通过 COPY //e... 来复制整个系统

回答 1 投票 0

我可以使用其损坏的符号名称获取指向 CUDA 内核的设备端指针吗?

注意:如果文章看起来很长,可以直接跳到最后以“我想知道..”开头的部分,以防有人想跳过构建/上下文。 构建/上下文: 为了...

回答 1 投票 0

实例化cuda时模板过度递归

我有一个模板函数,其中模板参数是整数。该整数用于创建不同的内核。以前,所有可能的模板都是在表格中手动实例化的......

回答 2 投票 0

在 CUDA 中重用事件“值得”吗?

在 CUDA 中使用事件时,我通常创建一个事件并立即将其记录在某个流上。同步后,我懒得保留那个 cudaEvent_t,在其他地方使用它 - 我只是...

回答 1 投票 0

澄清 CUDA 中的内存事务

我对 CUDA 编程指南 4.0 第 5.3.2.1 节中的以下陈述感到困惑 在绩效指南一章中。 全局内存驻留在设备内存中,设备内存是

回答 1 投票 0

什么是好的CUDA单线程排序算法?

我有一个cuda程序,其中每个线程必须对一个小数组(N = 49)进行排序。目前我正在使用 GeeksforGeeks 的简单堆排序算法,如下所示: __global__ 无效内核(int N){ ... d...

回答 2 投票 0

Scandit GPU 支持来利用它

我需要知道 scandit 是否支持 CUDA 或其他 Gpu 支持,以便我可以利用 GPU 而不是 CPU 来使用我的应用程序。 我也搜索过官方文档,但我...

回答 1 投票 0

Docker nvidia/cuda/pytorch 容器在 Dockerfile 中找不到 GPU

我正在尝试使用Pytorch和nvidia/cuda设置开发环境,但它不起作用。 以下命令按预期工作并识别 GPU: docker run --gpus all -it --rm nvcr...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.