pycuda 相关问题

PyCUDA是Python模块,为NVIDIA CUDA GPU计算环境提供了全面的pythonic接口。

内存访问使 CUDA 内核非常慢

我正在尝试使用 cuda 来制作一个基本的片段着色器,我发现实际执行内核需要超过一秒钟,这对于我试图实时运行的着色器来说是不可接受的......

回答 1 投票 0

如何修改此脚本,使其可以利用 GPU 而不是 CPU - moviepy > VideoFileClip

我有以下脚本将视频分成块并获得一定数量的块。它运行良好,但使用 cpu 而不是我的 RTX 3090 GPU 如何让它在最终渲染中使用 GPU?谢谢你...

回答 0 投票 0

我们可以运行基于GPU的偏置场校正方法吗?

是否可以在 GPU 上运行我在我的医学大脑项目的预处理阶段使用的基于 CPU 的偏置场校正方法?如果可能的话我该怎么做?请不要告诉我

回答 1 投票 0

当使用 torch cuda 脚本被杀死

我正在使用具有 GPU 的 Jetson Nano 设备。 >>> 进口手电筒 >>> 导入 torchvision >>> 火炬.__version__ '1.8.0' >>> torchvision.__version__ '0.9.0a0+01dfa8e' &g...

回答 0 投票 0

PyCUDA内核为特定计算返回不一致的除法结果

我正在尝试实现一个计算百分比平均值的内核。示例-取3D数组(在下面的代码中)片段[[2,4],[3,6],[4,8]]并计算(4 + 6 + 8)/(((4 + 6 + 8) +(2 + 3 + 4))这是一个...

回答 1 投票 0

Cuda cuLaunchHostFunc等效于python libs

[使用Python驱动CUDA,我想在发生内核和内存复制后在流中安排异步的Python宿主函数。是否有等效于CUDA C ++ ...

回答 1 投票 0


CUDA负数组索引测试

由于在C语言中有可能对一个负数组位置进行索引并超出数组范围,因此此代码可以编译并“运行”。 __global__ void do_something_bad(int * in_a){in_a [-1] = 666; //分配一个...

回答 1 投票 1

内存分配顺序在PyCUDA的规则中是否重要?

我通过CUDA统一内存[2]使用PyCUDA的接口[1]。在某个时候,我添加了随机数生成器[3]并注视着Jupyter Notebook中死掉的内核:我将问题缩小到...

回答 1 投票 0

我们如何访问CUDA中3D数组的列?

mod = SourceModule(“”“ __global__ void mat_ops(float * A,float * B){/ *获得唯一线程索引的公式* / int thrd = blockIdx.x * blockDim.x * blockDim.y + threadIdx.y * blockDim.x + threadIdx.x; ...

回答 1 投票 0

int变量可以在PyCUDA中从主机传输到设备吗?

作为CUDA导入pycuda.driver从pycuda.compiler导入pycuda.autoinit导入SourceModule导入numpy作为np dims = img_in.shape行= dims [0]列= dims [1]通道= dims [...

回答 1 投票 1

在TensorRT上添加多个推断(无效的资源处理错误)

我正在尝试使用Jetson Nano在管道中运行两个推断。第一个推论是使用MobileNet和TensorRT进行对象检测。我的第一个推论代码从...

回答 1 投票 0

PyCUDA认为53 * 53 == 2808

[我尝试使用pycuda计算53 * 53,如下所示:导入numpy为np导入pycuda.gpuarray为gpuarray导入pycuda.autoinit a = gpuarray.to_gpu(np.array([53]))print((a ** 2) .get()[0])那...

回答 1 投票 0

driver.Context.synchronize() - 还有什么需要考虑 - -a清理操作失败

我在这里有这个代码(由于答案而修改)。信息32字节堆栈帧,0字节溢出存储,0字节溢出加载ptxas信息:使用46个寄存器,120字节cmem [0],176字节cmem [2] ...

回答 3 投票 4

使用PyCUDA后没有输出

我用pip安装了PyCUDA。我试过两台电脑。一个是全新安装的Python 3.7.1,一个安装了Python 3.6.5。使用PuCUDA后没有错误消息,一切都失败了。 ......

回答 2 投票 14

并行编程方法解决熊猫问题

我有一个以下格式的数据框。 df A B目标5 4 3 1 3 4我使用pd.DataFrame(df.corr()。iloc [:...]找到每列(Target除外)与Target列的相关性

回答 2 投票 0

cuBLAS Dgemm产品与python

我有两个简单的矩阵A和B,我正在计算它们的乘法。数组看起来像这样(使用numpy作为模型)A = np.array(([1,2,3],[4,5,6]))。astype(np.float64)B = np.array(( [7,8],[9,...

回答 2 投票 1

如何在pyCUDA内核中生成随机数?

我正在使用pyCUDA进行CUDA编程。我需要在内核函数中使用随机数。 CURAND库在其中不起作用(pyCUDA)。因为,GPU中有很多工作要做,产生......

回答 2 投票 3

PyCuda - 如何在内核中使用Python编写的函数?

我想并行化我的Python代码,我正在尝试使用PyCuda。到目前为止我看到的是你必须在C代码中编写一个“内核”。这个内核将被并行化。 ...

回答 1 投票 0

PyCUDA无法在NVIDIA源代码中找到函数或抛出'可能没有extern“C”Linkage'错误

我试图通过将他的源代码复制到一个简单的pycuda应用程序中来使用(和学习)Mark Harris的优化还原内核(我的尝试的完整源代码如下所示)。不幸的是,我 ...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.