cuda 相关问题

CUDA是Nvidia GPU（图形处理单元）的并行计算平台和编程模型。 CUDA通过各种编程语言，库和API为Nvidia GPU提供了一个接口。

如何使用cudaMalloc / cudaMemcpy作为指向包含指针的结构的指针？

我看过这个网站和其他人，并没有任何效果。我正在为我的具体案例提出问题。我有一堆矩阵，目标是使用内核让...

pointers cuda

回答 1 投票 0

LINUX上的tensorflow-gpu运行失败

我在ubuntu 16.04上安装了CUDA和cuDnn。 CUDA版本：9.0 //带驱动程序版本390.87 cuDNN版本：7.2用于CUDA9.0导入tensorflow因为tf工作正常，但是tf.Session（）呈现...

tensorflow cuda

回答 1 投票 -1

如何调用“cudaDeviceSetSharedMemConfig”和“cudaDeviceSetCacheConfig”

我正在尝试为GTX 1080上的cuda代码优化共享内存。为此，我想通过调用：cudaDeviceSetSharedMemConfig（...来更改共享内存库宽度和缓存配置）。

cuda

回答 1 投票 0

用于生成素数的程序，错误：“堆栈溢出”[关闭]

我有程序，它在CUDA中生成素数并在第138行程序崩溃：cudaMemcpy（gpudata，data，sizeof（int）* MAXSIZE，cudaMemcpyHostToDevice）;我收到了该行的“堆栈溢出”错误....

c++ visual-studio cuda

回答 1 投票 -4

Visual Studio 2017 msvc vs nvcc __cplusplus宏不匹配

我使用的是Visual Studio 2017，平台工具集v141和CUDA Toolkit 9.2。我注意到在使用nvcc编译thrust :: device_vector时，不存在移动构造函数和移动赋值。 ......

c++ cmake cuda visual-studio-2017 thrust

回答 1 投票 0

CUDA驱动程序版本不足以用于CUDA运行时版本

我收到消息：“cutilCheckMsg（）CUTIL CUDA错误：内核启动失败：CUDA驱动程序版本不足以用于CUDA运行时版本。”在尝试运行示例源代码时。还......

cuda

回答 7 投票 22

为Torch和Tensorflow分配两个独立的GPU

我正在比较两个预先训练的模型，一个在Tensorflow中，另一个在Pytorch中，在具有多个GPU的机器上。每个型号都适合一个GPU。它们都加载在相同的Python脚本中。怎么样 ...

tensorflow cuda pytorch torch

回答 1 投票 0

在pytorch安装的CUDA HOME

我通过conda安装了pytorch cuda 7.5 conda install pytorch = 0.3.0 cuda75 -c pytorch >>> import torch >>> torch.cuda.is_available（）真的我没有做任何其他安装......

cuda pytorch yolo

回答 1 投票 1

如何解释ptx函数名称

当我编译我的cuda文件时：nvcc -arch = sm_61 -std = c ++ 11 -Xptxas -v，-warn-spills --use_fast_math -maxrregcount 128 nv_wavenet_perf.cu -o nv_wavenet_perf_dual我收到多行注册溢出...

cuda nvcc ptx

回答 1 投票 1

cuda从设备内存中复制内核中动态malloc的数据

我遇到了一个关于将cudaMemcpy与cudaMemcpyDeviceToHost一起使用的问题。有一个结构有一个指针int * a，它将在内核函数中使用malloc。然后我需要将此int * a复制到主机...

cuda malloc

回答 1 投票 0

在没有平铺的情况下为矩阵乘法内核选择每个块的线程数和块数

我为每个块选择了64个或更多的线程数（128个块），用于将两个大小为8192的矩阵乘以8192。我得到的只是我矩阵中的0。你能告诉我它的原因吗？ ...

cuda matrix-multiplication gpu-programming

回答 1 投票 -2

随机访问gpgpu性能下降？

我听说在gpu上对随机访问的数组执行计算时性能会下降。我的问题是这种性能下降有多严重？搜索一些评论......

cuda gpgpu

回答 1 投票 -2

NVCC unistd.h（792）：错误：预期标识符

NVCC正在返回一个错误，但几乎没有信息可以继续。在转向所谓的“现代cmake”之前，该项目已经编译完成。我不再使用findCUDA。我做过多次网络搜索但不能...

cuda linker nvcc unistd.h

回答 1 投票 0

LNK1104：无法打开文件'glut32.lib'

我正在使用“CUDA bu Example”一书来开始使用CUDA。但是当我包含书中给出的所有头文件然后得到ERROR为错误1错误LNK1104：无法打开文件'glut32.lib'D：\ book \ book \ ...

cuda glut

回答 4 投票 1

如何在开普勒实施全球原子操作？我使用gmem而不是使用原子来降低性能

我想知道开普勒全局原子的实现。看到这段代码：1。if（threadIdx.x <workers）{2。temp = atomicAdd（dst，temp + rangeOffset）; 3.如果（...

cuda gpu-atomics

回答 2 投票 1

在Nvidia的NVCC编译器中使用多个“arch”标志的目的是什么？

我最近了解了NVCC如何为不同的计算架构编译CUDA设备代码。根据我的理解，当使用NVCC的-gencode选项时，“arch”是最小的计算...

cuda nvcc ptx

回答 2 投票 30

VS2017和GTX 870M的CUDA版本是什么？

我想使用CUDA开发一个程序，但我在NVidia网站上的安装说明中迷失了方向。所以这就是我所拥有的：带有NVidia GPU GeForce GTX 870M的Windows 10笔记本电脑（OS和GPU ......

visual-studio cuda visual-studio-2017

回答 1 投票 0

Tensorflow：我安装了CUDA 9.2但它需要9.0？

我按照书中的说明安装了CUDA Toolkit 9.2版。然后我收到此错误ImportError：找不到'cudart64_90.dll'。 TensorFlow要求将此DLL安装在...

tensorflow cuda

回答 5 投票 12

cudaMallocManaged with vector > C ++ - NVIDIA CUDA

我正在通过NVIDIA GeForce GT 650M GPU实现多线程，以实现我创建的模拟。为了确保一切正常，我创建了一些侧面代码......

c++ vector cuda

回答 1 投票 0

为什么numba cuda在几次回忆之后运行缓慢？

我正在尝试如何在numba中使用cuda。但是我遇到了一些与我的期望不同的东西。这是我的代码来自numba import cuda @ cuda.jit def matmul（A，B，C）：“”执行......

python-3.x cuda numba pycuda numba-pro

回答 1 投票 1

cuda 相关问题

最新问题