cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

如何使用cudaMalloc / cudaMemcpy作为指向包含指针的结构的指针?

我看过这个网站和其他人,并没有任何效果。我正在为我的具体案例提出问题。我有一堆矩阵,目标是使用内核让...

回答 1 投票 0

LINUX上的tensorflow-gpu运行失败

我在ubuntu 16.04上安装了CUDA和cuDnn。 CUDA版本:9.0 //带驱动程序版本390.87 cuDNN版本:7.2用于CUDA9.0导入tensorflow因为tf工作正常,但是tf.Session()呈现...

回答 1 投票 -1

如何调用“cudaDeviceSetSharedMemConfig”和“cudaDeviceSetCacheConfig”

我正在尝试为GTX 1080上的cuda代码优化共享内存。为此,我想通过调用:cudaDeviceSetSharedMemConfig(...来更改共享内存库宽度和缓存配置)。

回答 1 投票 0

用于生成素数的程序,错误:“堆栈溢出”[关闭]

我有程序,它在CUDA中生成素数并在第138行程序崩溃:cudaMemcpy(gpudata,data,sizeof(int)* MAXSIZE,cudaMemcpyHostToDevice);我收到了该行的“堆栈溢出”错误....

回答 1 投票 -4

Visual Studio 2017 msvc vs nvcc __cplusplus宏不匹配

我使用的是Visual Studio 2017,平台工具集v141和CUDA Toolkit 9.2。我注意到在使用nvcc编译thrust :: device_vector时,不存在移动构造函数和移动赋值。 ......

回答 1 投票 0

CUDA驱动程序版本不足以用于CUDA运行时版本

我收到消息:“cutilCheckMsg()CUTIL CUDA错误:内核启动失败:CUDA驱动程序版本不足以用于CUDA运行时版本。”在尝试运行示例源代码时。还......

回答 7 投票 22

为Torch和Tensorflow分配两个独立的GPU

我正在比较两个预先训练的模型,一个在Tensorflow中,另一个在Pytorch中,在具有多个GPU的机器上。每个型号都适合一个GPU。它们都加载在相同的Python脚本中。怎么样 ...

回答 1 投票 0

在pytorch安装的CUDA HOME

我通过conda安装了pytorch cuda 7.5 conda install pytorch = 0.3.0 cuda75 -c pytorch >>> import torch >>> torch.cuda.is_available()真的我没有做任何其他安装......

回答 1 投票 1

如何解释ptx函数名称

当我编译我的cuda文件时:nvcc -arch = sm_61 -std = c ++ 11 -Xptxas -v,-warn-spills --use_fast_math -maxrregcount 128 nv_wavenet_perf.cu -o nv_wavenet_perf_dual我收到多行注册溢出...

回答 1 投票 1

cuda从设备内存中复制内核中动态malloc的数据

我遇到了一个关于将cudaMemcpy与cudaMemcpyDeviceToHost一起使用的问题。有一个结构有一个指针int * a,它将在内核函数中使用malloc。然后我需要将此int * a复制到主机...

回答 1 投票 0

在没有平铺的情况下为矩阵乘法内核选择每个块的线程数和块数

我为每个块选择了64个或更多的线程数(128个块),用于将两个大小为8192的矩阵乘以8192。我得到的只是我矩阵中的0。你能告诉我它的原因吗? ...

回答 1 投票 -2

随机访问gpgpu性能下降?

我听说在gpu上对随机访问的数组执行计算时性能会下降。我的问题是这种性能下降有多严重?搜索一些评论......

回答 1 投票 -2

NVCC unistd.h(792):错误:预期标识符

NVCC正在返回一个错误,但几乎没有信息可以继续。在转向所谓的“现代cmake”之前,该项目已经编译完成。我不再使用findCUDA。我做过多次网络搜索但不能...

回答 1 投票 0

LNK1104:无法打开文件'glut32.lib'

我正在使用“CUDA bu Example”一书来开始使用CUDA。但是当我包含书中给出的所有头文件然后得到ERROR为错误1错误LNK1104:无法打开文件'glut32.lib'D:\ book \ book \ ...

回答 4 投票 1

如何在开普勒实施全球原子操作?我使用gmem而不是使用原子来降低性能

我想知道开普勒全局原子的实现。看到这段代码:1。if(threadIdx.x <workers){2。temp = atomicAdd(dst,temp + rangeOffset); 3.如果(...

回答 2 投票 1

在Nvidia的NVCC编译器中使用多个“arch”标志的目的是什么?

我最近了解了NVCC如何为不同的计算架构编译CUDA设备代码。根据我的理解,当使用NVCC的-gencode选项时,“arch”是最小的计算...

回答 2 投票 30

VS2017和GTX 870M的CUDA版本是什么?

我想使用CUDA开发一个程序,但我在NVidia网站上的安装说明中迷失了方向。所以这就是我所拥有的:带有NVidia GPU GeForce GTX 870M的Windows 10笔记本电脑(OS和GPU ......

回答 1 投票 0

Tensorflow:我安装了CUDA 9.2但它需要9.0?

我按照书中的说明安装了CUDA Toolkit 9.2版。然后我收到此错误ImportError:找不到'cudart64_90.dll'。 TensorFlow要求将此DLL安装在...

回答 5 投票 12

cudaMallocManaged with vector > C ++ - NVIDIA CUDA

我正在通过NVIDIA GeForce GT 650M GPU实现多线程,以实现我创建的模拟。为了确保一切正常,我创建了一些侧面代码......

回答 1 投票 0

为什么numba cuda在几次回忆之后运行缓慢?

我正在尝试如何在numba中使用cuda。但是我遇到了一些与我的期望不同的东西。这是我的代码来自numba import cuda @ cuda.jit def matmul(A,B,C):“”执行......

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.