cuda 相关问题

CUDA是Nvidia GPU（图形处理单元）的并行计算平台和编程模型。 CUDA通过各种编程语言，库和API为Nvidia GPU提供了一个接口。

nvcc致命：不支持的gpu架构'compute_20'而cuda 9.1 + caffe + openCV 3.4.0已安装

我安装了CUDA 9.1 + cudnn-9.1 + opencv 3.4.0 + caffe。当我尝试在caffe目录中运行make all -j8时，发生了以下错误：nvcc致命：不支持的gpu体系结构'compute_20'我有......

opencv cmake cuda caffe cudnn

回答 1 投票 6

Numba和guvectorize for CUDA目标：代码运行速度低于预期

值得注意的细节大数据集（1000万x 5），（200 x 1000万x 5）Numpy大部分在每次运行后都需要更长时间使用Spyder3 Windows 10首先要尝试使用guvectorize与...

python performance cuda numba nvprof

回答 2 投票 1

基本的cuda共享内存

我是cuda的新手并且有一些关于共享内存的问题：每个SM在同一个GPU中是否拥有相同数量的共享内存？ SM如何在...之间划分共享内存？

cuda

回答 1 投票 0

cuda nvcc使__device__有条件

我正在尝试将cuda后端添加到20k loc c ++表达式模板库中。到目前为止，它工作得很好，但我完全被淹没了“警告：从__host__调用__host__函数...

cuda nvcc

回答 3 投票 1

Cuda并行化内核共享计数器变量

有没有办法让一个整数计数器变量可以在并行化的cuda内核中的所有线程上递增/递减？以下代码输出“[1]”，因为对......的修改

python parallel-processing cuda numba

回答 1 投票 2

使GPU C ++ Pi近似在GPU上并行运行Nvidia 970M CUDAs [关闭]

我从Chudnovsky公式得到了这个代码用于Pi近似，我想更快更快地完成它。但我没有经验或想法如何处理GPU。如何让这段代码在GPU上运行......

c++ cuda gpu nvidia pi

回答 1 投票 -2

用CUDA求解密集线性系统AX = B.

我可以使用新的cuSOLVER库（CUDA 7）来解决AX = B形式的线性系统，其中A，X和B是NxN密集矩阵吗？

cuda gpu cusolver

回答 1 投票 5

我是CUDA的新手并且正在进行第一个练习，即向量添加#include ＃包括＃包括 //计算向量和C = A + B // CUDA内核。每个......

c++ cuda

回答 1 投票 -1

CUB使用迭代器排序

我想一次性转换值并对它们进行排序，如下所示：thrust :: vector dataIn = ... thrust :: vector dataOut = ... auto iterIn = cub :: TransformInputIterator

cuda thrust cub

回答 1 投票 0

为CUDA内核调用设置VS 2010 Intellisense

我刚刚开始进行CUDA编程，而且它的功能非常好，我的GPU已经被认可了。我在Visual Studio中使用这个非常有用的指南部分设置了Intellisense：...

visual-studio-2010 cuda intellisense gpu-programming

回答 3 投票 16

cuda非法内存访问但有足够的内存

我试图运行下面的代码并遇到内存访问错误。我尝试运行cuda-memcheck并返回以下信息：由于相同的代码运行良好，因此对我来说很奇怪...

cuda

回答 1 投票 -1

一个奇怪的CUDA编译问题

该项目由CMake构建并由Visual Studio 2015编译。并且使用CUDA_ADD_LIBRARY命令将cuda代码编译为.lib文件。代码显示如下：//kernel.h #pragma once ...

cmake compilation cuda

回答 1 投票 -1

如果NVIDIA控制面板为计算设置优化，cuCtxCreate将失败

我通过JCuda API运行CUDA。当我使用NVIDIA控制面板为参与的JVM可执行文件（java.exe）设置计算优化（默认情况下是关闭）时，程序无法创建...

java cuda controlpanel jcuda

回答 1 投票 0

如何通过nvprof在短时间内分析CUDA应用程序？

我想通过nvprof生成限制配置文件。如何将分析时间限制在5秒钟？

cuda nvprof

回答 2 投票 0

CUDA：在if语句中写入全局内存的速度很慢

我有两个内核：模板 __global__ void bpcKernel（T * finalOutputPtr，const T * heatMapPtr，const T * peaksPtrA，const T * peaksPtrB，const unsigned int * bodyPartPairsPtr，const ...

cuda

回答 1 投票 0

Cuda并行化内核

我正在尝试在GPU上并行化模拟的简单更新循环。基本上有一堆由圆圈表示的“生物”，每个更新循环中都会移动，然后会有......

python parallel-processing cuda numba

回答 1 投票 -2

PyCUDA mem_get_ipc_handle给出LogicError：cuIpcGetMemHandle失败：不支持操作

我想在这里执行代码。我得到以下错误：orig：[0.36975162 0.08511397 0.16306844 0.4015488 0.25104857 0.30606773 0.24524205 0.13792656]处理过程-1：回溯（大多数...

cuda ipc pycuda

回答 1 投票 0

进入g ++编译步骤时Cuda编译错误

nvcc -D_DEBUG --use_fast_math -I“/usr/local/cuda-9.0//include”-I“/ usr / include / eigen3”-I“/home/xingfu/NVIDIA_CUDA-9.0_Samples/common/inc”-dlink --machine 64 -arch = sm_50 -c -o kernel_cuda.o .. / ...

cuda

回答 1 投票 0

如果CUDA线程遇到错误，有没有办法终止主机和设备程序执行？

我是CUDA编程的新手。在串行代码中，我经常使用一个函数，用于在发生错误后正常退出代码。例如。 void exit_with_error（char * message）{fprintf（stderr，“％s”，...

cuda gpu

回答 1 投票 0

CUDA对数：nvprof以双精度检测单精度运算

我在CUDA中以双精度计算“log（x）”，但是当我分析时，它使用度量“flop_count_sp_special”检测单精度操作。我正在编译“-arch = sm_30”以确保......

cuda gpu nvidia nvprof

回答 1 投票 -1

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.