请参阅[tag:gpu]的标签条目。
Nsight在VS10中跳过(忽略)断点 Cuda工作正常,nsight一直跳过几个断点。
我用的是nsight 2.2,Toolkit 4.2,最新的nvidia驱动,我的电脑里用的是几个GPU。Build customize 4.2. 我在CUDA的项目属性中设置了 "generate GPU ouput",nsight监控器打开了(...
我正在用PhysiX实现流体模拟器。不幸的是,cuda上下文管理器出了问题,我有一个问题,识别它是什么。我有一个init方法,它看起来像这样: void ...。
计算着色器。为什么是RWTexture2d<float4>?
我有一个ID3D11Texture2D和ID3D11UnorderedAccessView,格式为DXGI_FORMAT_R8G8B8A8_UNORM,着色器为RWTexture2d。 tex: register(u0); [numthreads(32, 32, 1)] void main(uint3 dtid : ...)
我正在利用OpenCL的enqueue_kernel()函数从GPU动态地enqueue内核,以减少不必要的主机交互。下面是一个简化的例子,说明了我在GPU中试图做的事情。
如何在一次openCv中更快地画出上千个圆圈--(可能使用GPU)
我需要在图像的给定区域(视频的帧)上绘制数千个点。使用循环是最简单的方法。 while i < num: x = random.randint(min_x, max_x) y = ...
我是CUDA的新手。我用的是几个1D的线块。只是线的一个维度,和块的一个维度。问题是,我有一个2维的数组,它必须像接下来的部分......。
a =(int *)malloc(sizeof(int)* N); b =(int *)malloc(sizeof(int)* N);如果我分配了一些内存,如何将a和b都初始化为1的?
a =(int *)malloc(sizeof(int)* N); b =(int *)malloc(sizeof(int)* N);如果我分配了一些内存,如何将a和b都初始化为1的?
[这是我的代码,我想将GPU用于我的代码。当前,它正在CPU上运行。 elf.graph = tf.Graph()与self.graph.as_default():self.face_graph = tf.GraphDef()fid = tf ....
我推测在使用PyTorch框架进行Conv网络训练时,我面临GPU内存泄漏。下图为解决此问题,我添加了-os.environ ['CUDA_LAUNCH_BLOCKING'] =“ 1”,此问题已解决...
将ROCm与Pycharm一起使用,Ubuntu 20.04
我一直在尝试通过AMD卡实现GPU加速以进行深度学习。尝试使用基于Docker的方法,直到最后才发现PyCharm中的Docker解释器...
我正在使用Matlab GPU计算来运行仿真。我怀疑我可能会遇到“随机数种子”重叠的问题。我的代码如下N = 10000; v = rand(N,1); p = [0:0.1:1]; pA = [0:0.1:...
我正在尝试使用tensorflow == 1.13.1在多个GPU上训练Grover的鉴别器模型。该模型的默认配置假定对多个TPU进行训练,并被证明可以在具有...
Compute Shaders:为什么使用RWTexture2d ?
已编辑的问题:我有一个ID3D11Texture2D和ID3D11UnorderedAccessView,格式为DXGI_FORMAT_R8G8B8A8_UNORM和着色器RWTexture2d tex:register(u0); [numthreads(32,32,1)] void ...
我是使用OpenACC进行GPU编程的初学者。我正在尝试进行直接卷积。卷积由6个嵌套循环组成。我只希望将第一个循环并行化。我给了杂注...
我正在使用Matlab,我想利用我的2个GPU,我有一个不适合1个GPU的大矩阵,但一半的矩阵适合1个GPU。因此,我想将矩阵切成两半,让我的每个人都... ...>
我有一个使用OpenCL在多个设备上拆分矩阵矢量乘法的应用程序。我在装有Intel Xeon CPU和三个相同的NVIDIA Kepler的计算机上测试了该应用程序...
针对新ArrayFire版本的问题自适应MatchFilter算法
我正在尝试将匹配的过滤器算法(在此处提供)用于arrayfire版本3.6.4。这就是我最终得到的结果:#include using namespace af; struct SAR_data {//! SAR ...
我正在使用Python3(CUDA 10.1和Intel MKL)(Pytorch 1.3.1)在AWS EC2深度学习AMI机器(Ubuntu 18.04.3 LTS(GNU / Linux 4.15.0-1054-aws x86_64v))上从头开始训练vgg16模型。 )并面向...
我有一个程序大约需要24小时才能运行。这些都是用VB.net编写的,大约有2000行。它已经是多线程的,并且可以正常工作(经过一些汗水和眼泪)。我...