OpenCL(开放计算语言)是一个用于编写程序的框架,这些程序跨CPU,GPU和其他处理器组成的异构平台执行。
我是 Adobe Premiere 和 GPU 加速的新手。我开始遵循使用 Premiere Pro CC 编辑视频的简单教程,当我将鼠标悬停在视频上时,几秒钟后出现“停止工作”错误...
工作项和流处理器(cuda core)之间有什么关系?我在某处读到,工作项的数量应该大大超过核心的数量,否则,就没有性能......
首先,请注意,这同样可以应用于编写 GPGPU 代码的图形着色器,尽管我的兴趣是 GPGPU,这就是示例代码“类似计算”的原因。 我们都知道G...
这是我关于堆栈溢出的第一篇文章,所以请耐心等待。 我目前正在编写 OpenCL 内核并需要使用内置 sqrt 函数。然而,要使其发挥作用,
JOCL CL_OUT_OF_RESOURCES 仅当已分配值时
我目前正在 OpenCL 中开发 sha256 内核。如果我通过内核向内核写入值,我将无法读取内核的输出。如果我不向变量写入任何值,则代码...
如何使用 OpenCL C++ API 获取设备 cl_device_id
我开始使用 OpenCL C++ API。我已经使用 C API 很长时间了。 C++ API 更加优雅、简单,代码更少且不易出错,但我需要设备 ID。我...
我遇到了一个问题,如果您能帮助我解决问题,我将非常感激。 我尝试使用 clang-17 编译下面看到的代码片段,但出现错误:
我正在尝试在 OpenCL 中计算 mod b,其中 a 是 ulong 元素的数组,并且是 b 长度的两倍。 __kernel void mod(__global ulong *a, __global ulong *b, __global ulong 长度) { ...
我一直在寻找,但运气不佳。 OpenCL 是否有任何有据可查的 .NET 绑定实现? (如果有必要的话,我会为 CUDA 采取一些措施)。 我遇到过各种各样的情况
有没有办法在OpenCl中加载大小等于GPU全局内存大小的向量?
我的 GPU 有 12 GB 全局内存 (CL_DEVICE_GLOBAL_MEM_SIZE),但只能分配 3 GB 内存 (CL_DEVICE_MAX_MEM_ALLOC_SIZE)。当我尝试加载大小超过 3 GB 的向量时,pro...
我正在尝试分析为 RDNA3 AMD GPU 编译的 OpenCL 内核。 为此,我使用 Radeon GPU 分析器。 当我在分析器中加载 OpenCL 内核时,它会显示汇编指令...
安装 vortex 时出现 libhwloc.so.5 错误
安装所有依赖项后在 vortex 中尝试“make”时,出现以下错误: /usr/bin/ld:警告:/opt/pocl/runtime/lib/libOpenCL.so 需要的 libhwloc.so.5,未找到(尝试
OpenCL 的函数 clGetPlatformInfo 运行时问题。 Win10、VS2012
我的硬件是 Intel Core I7 6700、32 GB RAM、Nvidia GT1030。我的软件是Windows 10 64位,Visual Studio 2012 professional。我买了《OpenCL并行编程开发手册》这本书。
使用 Imagination IMG GPU 清除 OpenCL 缓冲区
我可以在 Intel、NVIDIA 和 AMD GPU 上使用 clEnqueueFillBuffer() 成功清除 OpenCL 缓冲区对象。 当我尝试在 Imagination IMG GPU 上执行相同操作时,我的程序出现段错误。 它可能...
我正在尝试使用 AMD OCL SDK 编译一个简单的 OpenCL 测试程序: #包括 #包括 int main() { cl_platform_id 平台; cl_device_id 设备; c...
OpenCL 标准表示在 if/while 块内使用屏障会导致未定义的行为。但我不明白为什么在 if/while 块中同步线程是不可能的;分歧的三...
在哪里可以找到 rocprofiler 派生的计数器描述和示例
我的 opencl 内核花了太长时间才能完成,rocprof 给了我以下计数器: |索引 |内核名称 | GPU id |队列 ID |队列索引 | PID | tid | GRD |工作组 | LDS | SCR |拱_vgpr |累积...
正如标题所示,OpenCL API 只检测我的 Intel iGPU,而不检测 CPU 本身。为什么有什么想法吗?我已经通过包管理器安装了 Intel-opencl-icd,但它似乎不是 e...
Intel GPU 上是否有等效的“扭曲尺寸”或“波前宽度”
在 Nvidia 上,将 CL_DEVICE_WARP_SIZE_NV 查询放入 clGetDeviceInfo 中,通常返回 32。 在 AMD 上,CL_DEVICE_WAVEFRONT_WIDTH_AMD 过去是 64,现在在更新的 AMD GP 上...
我想使用 clFFT 库执行 2D 实数到复数 FFT。输出数组只为实部和虚部保留零,这是不正确的(我有一个使用...实现的工作版本