CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。
如何使用cudaMalloc / cudaMemcpy作为指向包含指针的结构的指针?
我看过这个网站和其他人,并没有任何效果。我正在为我的具体案例提出问题。我有一堆矩阵,目标是使用内核让...
我在ubuntu 16.04上安装了CUDA和cuDnn。 CUDA版本:9.0 //带驱动程序版本390.87 cuDNN版本:7.2用于CUDA9.0导入tensorflow因为tf工作正常,但是tf.Session()呈现...
如何调用“cudaDeviceSetSharedMemConfig”和“cudaDeviceSetCacheConfig”
我正在尝试为GTX 1080上的cuda代码优化共享内存。为此,我想通过调用:cudaDeviceSetSharedMemConfig(...来更改共享内存库宽度和缓存配置)。
我有程序,它在CUDA中生成素数并在第138行程序崩溃:cudaMemcpy(gpudata,data,sizeof(int)* MAXSIZE,cudaMemcpyHostToDevice);我收到了该行的“堆栈溢出”错误....
Visual Studio 2017 msvc vs nvcc __cplusplus宏不匹配
我使用的是Visual Studio 2017,平台工具集v141和CUDA Toolkit 9.2。我注意到在使用nvcc编译thrust :: device_vector时,不存在移动构造函数和移动赋值。 ......
我收到消息:“cutilCheckMsg()CUTIL CUDA错误:内核启动失败:CUDA驱动程序版本不足以用于CUDA运行时版本。”在尝试运行示例源代码时。还......
我正在比较两个预先训练的模型,一个在Tensorflow中,另一个在Pytorch中,在具有多个GPU的机器上。每个型号都适合一个GPU。它们都加载在相同的Python脚本中。怎么样 ...
我通过conda安装了pytorch cuda 7.5 conda install pytorch = 0.3.0 cuda75 -c pytorch >>> import torch >>> torch.cuda.is_available()真的我没有做任何其他安装......
当我编译我的cuda文件时:nvcc -arch = sm_61 -std = c ++ 11 -Xptxas -v,-warn-spills --use_fast_math -maxrregcount 128 nv_wavenet_perf.cu -o nv_wavenet_perf_dual我收到多行注册溢出...
我遇到了一个关于将cudaMemcpy与cudaMemcpyDeviceToHost一起使用的问题。有一个结构有一个指针int * a,它将在内核函数中使用malloc。然后我需要将此int * a复制到主机...
我为每个块选择了64个或更多的线程数(128个块),用于将两个大小为8192的矩阵乘以8192。我得到的只是我矩阵中的0。你能告诉我它的原因吗? ...
NVCC正在返回一个错误,但几乎没有信息可以继续。在转向所谓的“现代cmake”之前,该项目已经编译完成。我不再使用findCUDA。我做过多次网络搜索但不能...
我正在使用“CUDA bu Example”一书来开始使用CUDA。但是当我包含书中给出的所有头文件然后得到ERROR为错误1错误LNK1104:无法打开文件'glut32.lib'D:\ book \ book \ ...
如何在开普勒实施全球原子操作?我使用gmem而不是使用原子来降低性能
我想知道开普勒全局原子的实现。看到这段代码:1。if(threadIdx.x <workers){2。temp = atomicAdd(dst,temp + rangeOffset); 3.如果(...
在Nvidia的NVCC编译器中使用多个“arch”标志的目的是什么?
我最近了解了NVCC如何为不同的计算架构编译CUDA设备代码。根据我的理解,当使用NVCC的-gencode选项时,“arch”是最小的计算...
我想使用CUDA开发一个程序,但我在NVidia网站上的安装说明中迷失了方向。所以这就是我所拥有的:带有NVidia GPU GeForce GTX 870M的Windows 10笔记本电脑(OS和GPU ......
Tensorflow:我安装了CUDA 9.2但它需要9.0?
我按照书中的说明安装了CUDA Toolkit 9.2版。然后我收到此错误ImportError:找不到'cudart64_90.dll'。 TensorFlow要求将此DLL安装在...
cudaMallocManaged with vector > C ++ - NVIDIA CUDA
我正在通过NVIDIA GeForce GT 650M GPU实现多线程,以实现我创建的模拟。为了确保一切正常,我创建了一些侧面代码......
我正在尝试如何在numba中使用cuda。但是我遇到了一些与我的期望不同的东西。这是我的代码来自numba import cuda @ cuda.jit def matmul(A,B,C):“”执行......