cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

动态数组获取“错误代码未指定启动失败”

我想在我的内核中用c变量使用动态数组,但是当我使用超过1个threa的线程时,我总是得到这个错误“错误代码未指定启动失败”。如果我评论这个代码c [...

回答 1 投票 -2

CUDA在内核代码中多次乘法运算

矩阵乘法的函数:__ global__ void gpu_matrix_mult(float * a,float * b,float * c,int m,int n,int k){int row = blockIdx.y * blockDim.y + threadIdx.y; int col = blockIdx.x * ...

回答 1 投票 0

Qt5中的Cuda Link错误

I'm starting to use Cuda 8.0 in Qt5.8 with Qt creator with Visual Studio 2015 x64 on Windows 10 and I got unresolved symbols like: cuda_code_cuda.o : error LNK2019: 澷朄夝愅捏奜晹晞崋atexit丆cuda_code_cuda. o ...

回答 1 投票 0

使用cuda c减少计算数组的总和

我遇到的一个问题是,当我运行我的cuda程序时,总是说在第167行的stats_gpu.cu中遇到了非法的内存访问。代码如下:#include

回答 1 投票 -2

Cuda不能将类拆分为头和实现

我有下一个文件Kernel.cu #include“cuda_runtime.h”#include“device_launch_parameters.h”#include #包括 #包括 #include&...

回答 1 投票 -1

CUDA内核调用:内核<< >>其中第三个“

我使用CUDA 9.1和visual stdio 2017 15.4.4来加速计算,当我在visual stdio中编辑代码时遇到了一些问题。虽然我可以正确编译项目,但第三个“&...

回答 1 投票 -1

thrust :: sort_by_key上的配置参数无效

我在尝试使用sort_by_key时遇到问题:我在终端中收到以下错误:在抛出'thrust :: system :: system_error'之后调用终止what():在cub _ :: ...之后

回答 1 投票 0

使用CUSP打印矩阵的csr格式

我正在尝试使用CUSP和CUDA将稀疏矩阵转换为csr格式。我稍微修改了CUSP文档中显示的代码:#include #包括 ...

回答 1 投票 -1

无法为cufftComplex数据类型分配CUDA设备内存

我正在尝试使用以下代码将cufftComplex数组分配到CUDA设备(GEFORCE GTX 1080)的内存中:cufftComplex * d_in,* d_out; int ds = sizeof(cufftComplex)* width * height; ...

回答 1 投票 -1

在Linux上找到CUDA安装

什么是最好的方式?以下是我的解决方案:echo $ PATH | sed“s /:/ \ n / g”| grep“cuda / bin”| sed“s / \ / bin // g”|头-n 1哪个nvcc | sed“s / \ / bin \ / nvcc //”其中nvcc | head -c -10他们都是......

回答 1 投票 4

将数据从寄存器复制到全局存储器

我是编写CUDA的初学者。我不明白如何将数据从寄存器复制或传输到全局内存。谁能举个例子?谢谢

回答 1 投票 -3

没有GPU的Nvcc

我正试图从更快的RCNN获得一个区域提案。我在github中发现了这个漂亮而又整洁的repo,但每当我执行shell命令时,sh make.sh,它会吐出一个cffi.error.VerificationError:...

回答 1 投票 0

使用gcc和nvcc编译时,eigen :: matrix反转的行为不同

我使用Eigen进行矩阵求逆(下面提供的代码)(让我们称之为inversion.cpp)。 Inversion.cpp用g ++编译并给出正确的逆。现在我将代码名称更改为Inversion.cu并尝试...

回答 1 投票 1

不允许通过从__host__ __device__函数调用__host__函数来编译推力集差异

我有两组A和B分别为20和10整数。 B是A的子集。我需要找到B的免费集合。我使用thrust :: set_difference找到集合差异,但它...

回答 1 投票 -1

GPU cuda代码可以在多个GPU卡上运行而无需任何实现吗?

我已经有一个基于GPU CUDA C ++的代码,可以在单个NVIDIA显卡上运行良好。是否可以通过添加新的NVIDIA卡来加速计算并在2个GPU卡上运行代码(...

回答 1 投票 -1

基于共享存储器的1d模板CUDA实现中的负数组索引

我目前正在使用CUDA编程,我正在尝试从我在网上找到的工作室学习幻灯片,可以在这里找到。我遇到的问题是幻灯片48.下面的代码......

回答 4 投票 6

为什么CUDA程序可以使用CMake“FIND_PACKAGE”,但不能使用“LANGUAGES CUDA”?

注意:之前的标题是“如何使用CMake编译CUDA程序,而不使用FIND_PACKAGE?”。编辑使关键问题更清晰。当以建议的方式使用CMake和CUDA时,......

回答 1 投票 -1

“nvprof”结果中“GPU活动”和“API调用”之间有什么区别?

“nvprof”结果中“GPU活动”和“API调用”之间有什么区别?我不知道为什么同一个功能有时差。例如,[CUDA memcpy DtoH]和......

回答 1 投票 1

使用CUDA Driver API VS2012时未解析的外部符号

我一直在尝试使用CUDA驱动程序API从这个代码加载.ptx文件和函数:CUdevice device; cuDeviceGet(&设备,0); CUcontext ctx; cuCtxCreate(CTX,0,设备); ...

回答 2 投票 0

没有规则可以制作目标Cuda + Qt + Linux

尝试编译qt + cuda + linux并得到此错误“没有规则来制作目标'cuda_code.o',需要'../Test/Obj/cuda_code_cuda.o'。停止。”,但我会一步一步地做所有事情以下说明和......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.