cuda 相关问题

CUDA是Nvidia GPU（图形处理单元）的并行计算平台和编程模型。 CUDA通过各种编程语言，库和API为Nvidia GPU提供了一个接口。

当编译器未提供 uint8_t 时，什么是更好的替代方案？

我正在使用 nvcc 编译 CUDA 内核。不幸的是，nvcc 似乎不支持 uint8_t，尽管它确实支持 int8_t（！）。为了可移植性、可读性，我宁愿不使用 unsigned char...

types cuda nvcc

回答 4 投票 0

如何将 GPUDirect RDMA 与 Infiniband 结合使用

我有两台机器。每台机器上都有多张 Tesla 卡。每台机器上还有一张 InfiniBand 卡。我想通过InfiniBa在不同机器上的GPU卡之间进行通信...

cuda openmpi infiniband gpudirect

回答 1 投票 0

Makefile 变量替换有时会被忽略

编译一个支持 CUDA 的 Aircrack-ng 版本，该版本已经有一段时间没有修复错误了，所以需要一些修补才能完成大部分工作。基本上make找不到相关的编译...

makefile cuda

回答 2 投票 0

在 WSL 中启用 NVIDIA GPU

我正在尝试让我的 GPU 在我的 WSL 环境和我的 Docker 容器中可用。我已遵循 Microsoft/NVIDIA 指南，但似乎不起作用。没有明显的错误，但是......

docker cuda windows-subsystem-for-linux ollama

回答 1 投票 0

具有动态分配共享内存的Cupy

考虑通过此链接中的 CUPY 在 python 中使用的以下 CUDA 内核 add_kernel = cp.RawKernel(r''' 外部“C”__global__ void my_add(const float* x1, const float* x2, float*...

cuda shared-memory cupy

回答 1 投票 0

Numba cuda.jit 和 njit 给出不同的结果

在下面的例子中，我有一个简单的CPU函数：将 numpy 导入为 np 从 numba 导入 njit、cuda @njit def cpu_func(a, b, c, d): 对于范围内的 i(len(a))：对于 l 在范围内(d[i], 0, ...

python numpy cuda precision numba

回答 1 投票 0

使用或不使用选项 -g -G 编译 CUDA 程序有什么区别

我有一个 CUDA 程序。如果我使用 -g -G 选项编译该程序，我可以获得正确的输出。如果我在没有 -g -G 选项的情况下编译它，我并不总是得到正确的输出。我的猜测是没有...

cuda

回答 1 投票 0

尝试使用compute-sanitizer时无法找到注入库libsanitizer-collection.so

compute-sanitizer --tool memcheck my_cuda_program 是我正在尝试做的事情。我正在尝试这个，因为我得到了线程 1 my_cuda_program 收到信号 CUDA_EXCEPTION_5，Warp 超出范围地址。什...

cmake cuda cuda-gdb cudatoolkit

回答 1 投票 0

使用 sm_21 编译时出现 CUDA 4.2 nvcc (cicc) 错误

我有一个奇怪的问题！我有一张 GTX 560 Ti 卡（计算能力 2.1），用于开发 CUDA 应用程序。现在经过数百次编译后，我得到了一个错误。也就是编译阶段...

cuda nvcc

回答 1 投票 0

为什么CUDA.rules有两个相同的命令行

CUDA.rules 文件的命令行是： echo [编译器路径] [保留] [CInterleavedPTX] [ExtraNvccOptions] [拱门] -ccbin “$(VCInstallDir)bin” [仿真] [FastMath] [定义] -Xcompiler &qu...

visual-studio cmd cuda build-rules

回答 2 投票 0

Linux 上的 CMake 找不到 CUDA

我使用的是 Fedora 40，并使用以下命令安装了 CUDA 工具包： sudo dnf config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/fedora39/x86_64/cuda-fedora39.repo...

linux cmake cuda fedora

回答 1 投票 0

为什么 `(x / y)[i]` 比 `x[i] / y[i]` 快？

我是 CuPy 和 CUDA/GPU 计算的新手。有人可以解释为什么 (x / y)[i] 比 x[i] / y[i] 快吗？当利用 GPU 加速计算时，是否有任何指南可以...

numpy cuda cupy

回答 1 投票 0

创建一个 Docker 镜像，包括所有必要的工具和依赖项

我尝试了这种方法来从服务器创建 Docker 映像。该服务器具有 Nvidia 3070 GPU，并运行这样的 AI 模型。该方法使用 Dockerfile 通过 COPY //e... 来复制整个系统

python docker cuda conda

回答 1 投票 0

我可以使用其损坏的符号名称获取指向 CUDA 内核的设备端指针吗？

注意：如果文章看起来很长，可以直接跳到最后以“我想知道..”开头的部分，以防有人想跳过构建/上下文。构建/上下文：为了...

c++ cuda function-pointers nvidia dynamic-parallelism

回答 1 投票 0

实例化cuda时模板过度递归

我有一个模板函数，其中模板参数是整数。该整数用于创建不同的内核。以前，所有可能的模板都是在表格中手动实例化的......

templates recursion cuda nvcc

回答 2 投票 0

在 CUDA 中重用事件“值得”吗？

在 CUDA 中使用事件时，我通常创建一个事件并立即将其记录在某个流上。同步后，我懒得保留那个 cudaEvent_t，在其他地方使用它 - 我只是...

events cuda

回答 1 投票 0

澄清 CUDA 中的内存事务

我对 CUDA 编程指南 4.0 第 5.3.2.1 节中的以下陈述感到困惑在绩效指南一章中。全局内存驻留在设备内存中，设备内存是

cuda gpu nvidia

回答 1 投票 0

什么是好的CUDA单线程排序算法？

我有一个cuda程序，其中每个线程必须对一个小数组（N = 49）进行排序。目前我正在使用 GeeksforGeeks 的简单堆排序算法，如下所示： __global__ 无效内核（int N）{ ... d...

sorting cuda

回答 2 投票 0

Scandit GPU 支持来利用它

我需要知道 scandit 是否支持 CUDA 或其他 Gpu 支持，以便我可以利用 GPU 而不是 CPU 来使用我的应用程序。我也搜索过官方文档，但我...

c++ sdk cuda gpu scandit

回答 1 投票 0

Docker nvidia/cuda/pytorch 容器在 Dockerfile 中找不到 GPU

我正在尝试使用Pytorch和nvidia/cuda设置开发环境，但它不起作用。以下命令按预期工作并识别 GPU： docker run --gpus all -it --rm nvcr...

docker pytorch dockerfile cuda

回答 1 投票 0

cuda 相关问题

最新问题