gpgpu 相关问题

GPGPU是计算机科学领域的首字母缩写,被称为“图形处理单元(GPU)上的通用计算”

目标和目标数据之间的差异?如何在没有团队指令的情况下进行团队/线程配置?

我有 2 个关于新 OpenMP 4.0 的问题。 第一个是我无法理解目标和目标数据之间有什么区别?根据规范目标数据创建新数据

回答 1 投票 0

Webgl:在 GPGPU 中使用鼠标偏移维护粒子位置

我有一个简单的粒子方块,我想随着鼠标的移动而移动,映射到-1到1,这样它的左下角就会粘在光标上。 这在顶点着色中相当容易......

回答 1 投票 0

我们可以在 CUDA 内核中使用 printf 或任何其他类似的函数吗?

我的矩阵加法示例: __global__ 无效matrix_add(浮点* a,浮点* b,浮点* c,int N) { 整数索引; int Row = blockIdx.y * blockDim.y + threadIdx.y; int Col = blockIdx.x * blockDi...

回答 3 投票 0

矩阵乘法中的扭曲级别减少

我正在尝试在 CUDA 中实现方阵乘法,并使用扭曲级基元优化点积的求和部分。我以前使用了一种幼稚的方法,但现在我正在尝试......

回答 1 投票 0

矩阵乘法中的扭曲级同步

我正在尝试在 CUDA 中实现方阵乘法,并使用扭曲级基元优化点积的求和部分。我以前使用了一种幼稚的方法,但现在我正在尝试......

回答 1 投票 0

将数据从CPU传递到GPU,而不显式地将其作为参数传递

是否可以将数据从CPU传递到GPU而不显式地将其作为参数传递? 我不想将它作为参数传递,主要是出于语法糖的原因 - 我有大约 20 个常量

回答 4 投票 0

CUDA的thrust::inclusive_scan()有'init'参数吗?

根据CUDA的Thrust库文档,thrust::inclusive_scan()有4个参数: OutputIterator推力::inclusive_scan(首先是InputIterator,

回答 2 投票 0

将 CUDA 或 OpenCL 编译为 llvm IR

Clang 可以将 CUDA(不完整)或 OpenCL 翻译为 llvm。它如何保留“共享”关键字,以便它知道共享内存和全局内存之间的区别?

回答 1 投票 0

如何为GPGPU创建不可见的X11窗口?

是否可以创建一个不可见的X窗口?为了初始化 OpenGL ES 2.0 上下文,必须手动创建一个 X 窗口,但我找不到一种方法让它不可见。因为我只是做...

回答 2 投票 0

尽管索引在范围内,但 __global__ 写入无效

我有一个设备函数抛出 Invalid __global__ write of size 4 bytes,我花了几个小时调试但无济于事。 有问题的函数看起来像这样(有不相关的 b...

回答 2 投票 0

如何使用CUDA刷新GPU内存(物理重置不可用)

我的 CUDA 程序在执行期间崩溃,然后内存被刷新。结果,设备内存仍然被占用。 我在 GTX 580 上运行,不支持 nvidia-smi --gpu-reset。 普拉...

回答 14 投票 0

GPU L1 缓存一致性

在OpenCL和CUDA中,分别有一些原语,即barrier()和__syncthreads(),来强制L1数据缓存/共享内存的一致性。这是否意味着缓存本身不兼容...

回答 2 投票 0

为什么在 opengl api 中计算的预过滤器辐射图与 dx11 相比看起来不同?

我有一个着色器,可以在 DX11 渲染器中计算辐射纹理,我想将其移植到 opengl。 //这个ifdef仅用于展示,它不在原始着色器中 // 因为版本很糟糕...

回答 1 投票 0

OpenCL 设备供应商 ID

使用 CL_DEVICE_VENDOR_ID 调用时,OpenCL clGetDeviceInfo 函数会返回设备供应商标识符。对于 CL_DEVICE_VENDOR_ID,OpenCL 规范规定:“唯一的设备供应商标识符。

回答 3 投票 0

使用 OpenMP Target Enter/Exit/Update 进行非结构化、异步设备端计算的正确方法是什么?

目标 我想以我当前使用 CUDA 的方式在 C++ 中使用 OpenMP 目标: 分配任意数量的设备端阵列(主机阵列的镜像即可),如果需要则进行初始化。 执行

回答 1 投票 0

在 OpenCL 中似乎无法达到我的 GPU 全局内存带宽

在我的 AMD GPU 上使用 opencl,我只能实现 clpeak 报告的 GPU 全局内存带宽(375 GB/秒)的 4%(15 GB/秒)。 在接受这一点之前,我想确保我......

回答 1 投票 0

当您在设备内部调用 cudaMalloc 时实际上会发生什么?

这实际上是有效的,所以我想知道cuda是否在线程中动态分配设备上的内存?如果是这样, __device__ malloc 有什么用,因为这在比较中要快得多......

回答 2 投票 0

gnupg get_key 在 php 中失败

我在 php 中使用 gnupg 作为数字签名文件。之前工作得很好。突然我收到这个错误: PHP 致命错误:未捕获异常“异常”,消息“get_key 失败” putenv(...

回答 3 投票 0

OpenCL 1.2:围绕原子操作的全局内存一致性?

我正在尝试使用原子在 OpenCL 1.2 中实现全局同步,并且想知道是否有任何方法可以确保从不同工作组进行读取(这可以证明——通过

回答 1 投票 0

在一个 GPU 上运行多个 CUDA 应用程序

CUDA文档没有具体说明多少个CUDA进程可以共享一个GPU。例如,如果我在系统中只安装了一张 GPU 卡的情况下,由同一用户启动多个 CUDA 程序,我会...

回答 4 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.