gpgpu 相关问题

GPGPU是计算机科学领域的首字母缩写，被称为“图形处理单元（GPU）上的通用计算”

目标和目标数据之间的差异？如何在没有团队指令的情况下进行团队/线程配置？

我有 2 个关于新 OpenMP 4.0 的问题。第一个是我无法理解目标和目标数据之间有什么区别？根据规范目标数据创建新数据

c parallel-processing openmp gpgpu

回答 1 投票 0

Webgl：在 GPGPU 中使用鼠标偏移维护粒子位置

我有一个简单的粒子方块，我想随着鼠标的移动而移动，映射到-1到1，这样它的左下角就会粘在光标上。这在顶点着色中相当容易......

vector game-physics gpgpu particles compute-shader

回答 1 投票 0

我们可以在 CUDA 内核中使用 printf 或任何其他类似的函数吗？

我的矩阵加法示例： __global__ 无效matrix_add（浮点* a，浮点* b，浮点* c，int N） { 整数索引； int Row = blockIdx.y * blockDim.y + threadIdx.y; int Col = blockIdx.x * blockDi...

cuda gpgpu gpu

回答 3 投票 0

矩阵乘法中的扭曲级别减少

我正在尝试在 CUDA 中实现方阵乘法，并使用扭曲级基元优化点积的求和部分。我以前使用了一种幼稚的方法，但现在我正在尝试......

cuda gpgpu

回答 1 投票 0

矩阵乘法中的扭曲级同步

我正在尝试在 CUDA 中实现方阵乘法，并使用扭曲级基元优化点积的求和部分。我以前使用了一种幼稚的方法，但现在我正在尝试......

cuda gpgpu

回答 1 投票 0

将数据从CPU传递到GPU，而不显式地将其作为参数传递

是否可以将数据从CPU传递到GPU而不显式地将其作为参数传递？我不想将它作为参数传递，主要是出于语法糖的原因 - 我有大约 20 个常量

c cuda gpgpu

回答 4 投票 0

CUDA的thrust::inclusive_scan()有'init'参数吗？

根据CUDA的Thrust库文档，thrust::inclusive_scan()有4个参数： OutputIterator推力::inclusive_scan（首先是InputIterator，

cuda gpgpu thrust

回答 2 投票 0

将 CUDA 或 OpenCL 编译为 llvm IR

Clang 可以将 CUDA（不完整）或 OpenCL 翻译为 llvm。它如何保留“共享”关键字，以便它知道共享内存和全局内存之间的区别？

compiler-construction llvm clang gpgpu

回答 1 投票 0

如何为GPGPU创建不可见的X11窗口？

是否可以创建一个不可见的X窗口？为了初始化 OpenGL ES 2.0 上下文，必须手动创建一个 X 窗口，但我找不到一种方法让它不可见。因为我只是做...

x11 opengl-es-2.0 gpgpu egl

回答 2 投票 0

尽管索引在范围内，但 __global__ 写入无效

我有一个设备函数抛出 Invalid __global__ write of size 4 bytes，我花了几个小时调试但无济于事。有问题的函数看起来像这样（有不相关的 b...

c++ cuda gpgpu

回答 2 投票 0

如何使用CUDA刷新GPU内存（物理重置不可用）

我的 CUDA 程序在执行期间崩溃，然后内存被刷新。结果，设备内存仍然被占用。我在 GTX 580 上运行，不支持 nvidia-smi --gpu-reset。普拉...

cuda gpgpu remote-access

回答 14 投票 0

GPU L1 缓存一致性

在OpenCL和CUDA中，分别有一些原语，即barrier()和__syncthreads()，来强制L1数据缓存/共享内存的一致性。这是否意味着缓存本身不兼容...

caching cuda gpu opencl gpgpu

回答 2 投票 0

为什么在 opengl api 中计算的预过滤器辐射图与 dx11 相比看起来不同？

我有一个着色器，可以在 DX11 渲染器中计算辐射纹理，我想将其移植到 opengl。 //这个ifdef仅用于展示，它不在原始着色器中 // 因为版本很糟糕...

c++ opengl graphics directx gpgpu

回答 1 投票 0

OpenCL 设备供应商 ID

使用 CL_DEVICE_VENDOR_ID 调用时，OpenCL clGetDeviceInfo 函数会返回设备供应商标识符。对于 CL_DEVICE_VENDOR_ID，OpenCL 规范规定：“唯一的设备供应商标识符。

opencl gpgpu

回答 3 投票 0

使用 OpenMP Target Enter/Exit/Update 进行非结构化、异步设备端计算的正确方法是什么？

目标我想以我当前使用 CUDA 的方式在 C++ 中使用 OpenMP 目标：分配任意数量的设备端阵列（主机阵列的镜像即可），如果需要则进行初始化。执行

c++ oop asynchronous openmp gpgpu

回答 1 投票 0

在 OpenCL 中似乎无法达到我的 GPU 全局内存带宽

在我的 AMD GPU 上使用 opencl，我只能实现 clpeak 报告的 GPU 全局内存带宽（375 GB/秒）的 4%（15 GB/秒）。在接受这一点之前，我想确保我......

opencl gpgpu amd-gpu opencl-c memory-bandwidth

回答 1 投票 0

当您在设备内部调用 cudaMalloc 时实际上会发生什么？

这实际上是有效的，所以我想知道cuda是否在线程中动态分配设备上的内存？如果是这样， __device__ malloc 有什么用，因为这在比较中要快得多......

c++ cuda gpgpu

回答 2 投票 0

gnupg get_key 在 php 中失败

我在 php 中使用 gnupg 作为数字签名文件。之前工作得很好。突然我收到这个错误： PHP 致命错误：未捕获异常“异常”，消息“get_key 失败” putenv(...

php gpgpu gnupg

回答 3 投票 0

OpenCL 1.2：围绕原子操作的全局内存一致性？

我正在尝试使用原子在 OpenCL 1.2 中实现全局同步，并且想知道是否有任何方法可以确保从不同工作组进行读取（这可以证明——通过

concurrency parallel-processing opencl gpgpu consistency

回答 1 投票 0

在一个 GPU 上运行多个 CUDA 应用程序

CUDA文档没有具体说明多少个CUDA进程可以共享一个GPU。例如，如果我在系统中只安装了一张 GPU 卡的情况下，由同一用户启动多个 CUDA 程序，我会...

cuda gpu gpgpu nvidia

回答 4 投票 0

gpgpu 相关问题

最新问题