cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

错误:属性“__global__”在这里不适用

nvcc 无法识别带有 cuda 12.5 的 Windows 11 上的内核 (我可以使用 powershell 编译其他 *.cu 文件) nvcc -arch=sm_89 .\simplest_kernel.cu #包括 #包括<

回答 1 投票 0

如何在具有相同 CUDA 的虚拟环境中设置 TF 和 Torch

我想在一个具有相同 CUDA 的虚拟环境中设置 TensorFlow 和 pytorch。但是,我找不到可以同时支持tensorflow和pytorch的CUDA版本:对于tensorflow 2.10,我选择了...

回答 1 投票 0

为什么我在 CUDA 中的性能这么差?

我有Linux下的RTX 3050,原生NVidia驱动程序。同样的简单代码在 GPU 2.1GHz 上的执行速度比在 CPU 2.4GHz 上慢 10 倍。可能出了什么问题:驱动程序、编译器标志,或者这是正常的

回答 2 投票 0

CUDA 流(=队列)的容量是多少?

CUDA 流是一个任务队列:内存复制、事件触发、事件等待、内核启动、回调... 但是 - 这些队列的容量不是无限的。事实上,根据经验,我发现这...

回答 2 投票 0

MSVC 拒绝 GCC 接受的行语法 - 发出奇怪的抱怨

在我的代码中,我有以下函数模板: 模板 // 下一行是文件中的第 645 行 void copy(T(&destination)[N], span 源,

回答 1 投票 0

在 pytorch 中,如何并行化(在 GPU 上)重复执行的一组布尔函数?

我有一组独立的布尔函数,并且(假设)可以并行执行。我想重复调用这些相同的函数。请参阅下面的代码,其中的输出...

回答 1 投票 0

编译CUDA时出错

我正在尝试编译一个C程序来尝试并行编程,当我尝试使用nvcc编译器(Nvidia)编译它时,它给了我这些错误: inicis.cu(3):错误:属性“全局”不适用...

回答 2 投票 0

如果我告诉 NVCC -gencode arch=native,我该如何使用 code= 参数?

假设我的机器有具有计算能力 XX 和 YY 的 GPU。读过: https://stackoverflow.com/a/35657430/1593077 我知道我可以像这样调用 nvcc: NVCC\ -o myapp \ -gencode拱=

回答 1 投票 0

为 CUDA C/C++ 编译器添加永久包含和库路径

我目前正在做一些工作,包括使用CULA库和GPU计算SDK的库。 编译时,我必须在使用 NVCC 编译时使用以下标志: -lcutil_x86_64 -

回答 1 投票 0

CUB 按键减少

Thrust 有算法: 按键排序 按键减少 这对于我的问题来说可以很好地协同工作。我想尝试使用 CUB 来更好地控制内存和流以及与我的交互......

回答 1 投票 0

为 CUDA V9.1.85 安装 jax 和 jaxlib

我正在使用Python 3.8.0和CUDA 9.1.85(CUDA编译工具,版本9.1)(或不?见下文)。不幸的是,我没有管理权限,所以我无法升级其中任何一个。 ...

回答 1 投票 0

C++切换GPU设备后需要重做cudaHostRegister吗?

例如,如果我切换设备,看起来我不需要执行cudaHostUnregister和cudaHostRegister。 性能和GPU共享内存没有太大变化。 // 将设备设置为 0 cuda错误...

回答 1 投票 0

用c++切换GPU设备后需要重做cudaHostRegister吗

例如: 看起来如果我切换设备,我不需要执行 cudaHostUnregister 和 CudaHostRegister 。 性能和两个GPU共享内存没有太大变化。 // 将设备设置为 0...

回答 1 投票 0

CUDA如何实现printf()?

我在我的CUDA内核中编写了一个简单的代码来检查数据的正确性: #包括 __global__ void testKernel(int *data, int n){ size_t tid = threadIdx.x + blockIdx.x * 块...

回答 1 投票 0

使用cudaFree释放不同设备中的GPU内存

我可以使用 cudaFree 释放在另一个设备中分配的 GPU 内存吗? cudaSetDevice(0); cudaMalloc(&devPtr, 大小); cudaSetDevice(1); cudaFree(devPtr); 如果我的系统支持统一虚拟化...

回答 1 投票 0

CUDA 合作组:链接错误

在阅读了 CUDA 9 中的协作组之后,我一直在尝试在网格级别进行同步。 我使用的是 Visual Studio 2017、GTX 1060 和 CUDA 9.1。 我修改了我的代码如下: __全局__ 无效

回答 1 投票 0

如何更改CUDA版本

我在编译修改后的caffe版本时遇到了这个错误。 OpenCV 静态库是使用 CUDA 7.5 支持编译的。请使用相同版本或使用 CUDA 8.0 重建 OpenCV 我有一些旧代码...

回答 6 投票 0

使用 clang 编译 CUDA 时 C++ 虚拟类出现 nvlink 错误

在处理 CUDA 项目时,我收到一个 nvlink 错误,指出 __cxa_pure_virtual 具有未定义的引用。我的存储库的结构类似于 ModernCMake - 扩展示例中的示例。 惊喜...

回答 1 投票 0

cuFFT 分析问题

我正在尝试获取 cuFFT 库调用的分析数据,例如计划和执行。我正在使用 nvprof(命令行分析工具),带有“--print-api-trace”选项。它打印......的时间

回答 3 投票 0

TensorFlow 2.14.0 无法在 Google Colab 上检测到 GPU

我正在尝试在 Google Colab 上将 Mask-RCNN 与 GPU 结合使用,因为我需要本地计算机所缺乏的强大 GPU。为此,我什至订阅了 Google Colab Pro。我已经实现了一个存储库

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.