cuda 相关问题

CUDA是Nvidia GPU(图形处理单元)的并行计算平台和编程模型。 CUDA通过各种编程语言,库和API为Nvidia GPU提供了一个接口。

nvcc致命:不支持的gpu架构'compute_20'而cuda 9.1 + caffe + openCV 3.4.0已安装

我安装了CUDA 9.1 + cudnn-9.1 + opencv 3.4.0 + caffe。当我尝试在caffe目录中运行make all -j8时,发生了以下错误:nvcc致命:不支持的gpu体系结构'compute_20'我有......

回答 1 投票 6

Numba和guvectorize for CUDA目标:代码运行速度低于预期

值得注意的细节大数据集(1000万x 5),(200 x 1000万x 5)Numpy大部分在每次运行后都需要更长时间使用Spyder3 Windows 10首先要尝试使用guvectorize与...

回答 2 投票 1

基本的cuda共享内存

我是cuda的新手并且有一些关于共享内存的问题:每个SM在同一个GPU中是否拥有相同数量的共享内存? SM如何在...之间划分共享内存?

回答 1 投票 0

cuda nvcc使__device__有条件

我正在尝试将cuda后端添加到20k loc c ++表达式模板库中。到目前为止,它工作得很好,但我完全被淹没了“警告:从__host__调用__host__函数...

回答 3 投票 1

Cuda并行化内核共享计数器变量

有没有办法让一个整数计数器变量可以在并行化的cuda内核中的所有线程上递增/递减?以下代码输出“[1]”,因为对......的修改

回答 1 投票 2

使GPU C ++ Pi近似在GPU上并行运行Nvidia 970M CUDAs [关闭]

我从Chudnovsky公式得到了这个代码用于Pi近似,我想更快更快地完成它。但我没有经验或想法如何处理GPU。如何让这段代码在GPU上运行......

回答 1 投票 -2

用CUDA求解密集线性系统AX = B.

我可以使用新的cuSOLVER库(CUDA 7)来解决AX = B形式的线性系统,其中A,X和B是NxN密集矩阵吗?

回答 1 投票 5

矢量加CUDA

我是CUDA的新手并且正在进行第一个练习,即向量添加#include #包括 #包括 //计算向量和C = A + B // CUDA内核。每个......

回答 1 投票 -1

CUB使用迭代器排序

我想一次性转换值并对它们进行排序,如下所示:thrust :: vector dataIn = ... thrust :: vector dataOut = ... auto iterIn = cub :: TransformInputIterator

回答 1 投票 0

为CUDA内核调用设置VS 2010 Intellisense

我刚刚开始进行CUDA编程,而且它的功能非常好,我的GPU已经被认可了。我在Visual Studio中使用这个非常有用的指南部分设置了Intellisense:...

回答 3 投票 16

cuda非法内存访问但有足够的内存

我试图运行下面的代码并遇到内存访问错误。我尝试运行cuda-memcheck并返回以下信息:由于相同的代码运行良好,因此对我来说很奇怪...

回答 1 投票 -1

一个奇怪的CUDA编译问题

该项目由CMake构建并由Visual Studio 2015编译。并且使用CUDA_ADD_LIBRARY命令将cuda代码编译为.lib文件。代码显示如下://kernel.h #pragma once ...

回答 1 投票 -1

如果NVIDIA控制面板为计算设置优化,cuCtxCreate将失败

我通过JCuda API运行CUDA。当我使用NVIDIA控制面板为参与的JVM可执行文件(java.exe)设置计算优化(默认情况下是关闭)时,程序无法创建...

回答 1 投票 0

如何通过nvprof在短时间内分析CUDA应用程序?

我想通过nvprof生成限制配置文件。如何将分析时间限制在5秒钟?

回答 2 投票 0

CUDA:在if语句中写入全局内存的速度很慢

我有两个内核:模板 __global__ void bpcKernel(T * finalOutputPtr,const T * heatMapPtr,const T * peaksPtrA,const T * peaksPtrB,const unsigned int * bodyPartPairsPtr,const ...

回答 1 投票 0

Cuda并行化内核

我正在尝试在GPU上并行化模拟的简单更新循环。基本上有一堆由圆圈表示的“生物”,每个更新循环中都会移动,然后会有......

回答 1 投票 -2

PyCUDA mem_get_ipc_handle给出LogicError:cuIpcGetMemHandle失败:不支持操作

我想在这里执行代码。我得到以下错误:orig:[0.36975162 0.08511397 0.16306844 0.4015488 0.25104857 0.30606773 0.24524205 0.13792656]处理过程-1:回溯(大多数...

回答 1 投票 0

进入g ++编译步骤时Cuda编译错误

nvcc -D_DEBUG --use_fast_math -I“/usr/local/cuda-9.0//include”-I“/ usr / include / eigen3”-I“/home/xingfu/NVIDIA_CUDA-9.0_Samples/common/inc”-dlink --machine 64 -arch = sm_50 -c -o kernel_cuda.o .. / ...

回答 1 投票 0

如果CUDA线程遇到错误,有没有办法终止主机和设备程序执行?

我是CUDA编程的新手。在串行代码中,我经常使用一个函数,用于在发生错误后正常退出代码。例如。 void exit_with_error(char * message){fprintf(stderr,“%s”,...

回答 1 投票 0

CUDA对数:nvprof以双精度检测单精度运算

我在CUDA中以双精度计算“log(x)”,但是当我分析时,它使用度量“flop_count_sp_special”检测单精度操作。我正在编译“-arch = sm_30”以确保......

回答 1 投票 -1

© www.soinside.com 2019 - 2024. All rights reserved.