opencl 相关问题

OpenCL(开放计算语言)是一个用于编写程序的框架,这些程序跨CPU,GPU和其他处理器组成的异构平台执行。

OpenCL 检测错误

我是 Adobe Premiere 和 GPU 加速的新手。我开始遵循使用 Premiere Pro CC 编辑视频的简单教程,当我将鼠标悬停在视频上时,几秒钟后出现“停止工作”错误...

回答 2 投票 0

Opencl 工作项和流处理器

工作项和流处理器(cuda core)之间有什么关系?我在某处读到,工作项的数量应该大大超过核心的数量,否则,就没有性能......

回答 2 投票 0

这个 GPU 计算或着色器模式叫什么(如果有的话)?

首先,请注意,这同样可以应用于编写 GPGPU 代码的图形着色器,尽管我的兴趣是 GPGPU,这就是示例代码“类似计算”的原因。 我们都知道G...

回答 1 投票 0

在 OpenCL 中将整数转换为浮点数

这是我关于堆栈溢出的第一篇文章,所以请耐心等待。 我目前正在编写 OpenCL 内核并需要使用内置 sqrt 函数。然而,要使其发挥作用,

回答 1 投票 0

JOCL CL_OUT_OF_RESOURCES 仅当已分配值时

我目前正在 OpenCL 中开发 sha256 内核。如果我通过内核向内核写入值,我将无法读取内核的输出。如果我不向变量写入任何值,则代码...

回答 1 投票 0

如何使用 OpenCL C++ API 获取设备 cl_device_id

我开始使用 OpenCL C++ API。我已经使用 C API 很长时间了。 C++ API 更加优雅、简单,代码更少且不易出错,但我需要设备 ID。我...

回答 1 投票 0

在 OpenCL 内核中使用模板化结构作为参数

我遇到了一个问题,如果您能帮助我解决问题,我将非常感激。 我尝试使用 clang-17 编译下面看到的代码片段,但出现错误:

回答 1 投票 0

OpenCL 大数取模

我正在尝试在 OpenCL 中计算 mod b,其中 a 是 ulong 元素的数组,并且是 b 长度的两倍。 __kernel void mod(__global ulong *a, __global ulong *b, __global ulong 长度) { ...

回答 2 投票 0

完整的 .NET OpenCL 实现 [已关闭]

我一直在寻找,但运气不佳。 OpenCL 是否有任何有据可查的 .NET 绑定实现? (如果有必要的话,我会为 CUDA 采取一些措施)。 我遇到过各种各样的情况

回答 7 投票 0

有没有办法在OpenCl中加载大小等于GPU全局内存大小的向量?

我的 GPU 有 12 GB 全局内存 (CL_DEVICE_GLOBAL_MEM_SIZE),但只能分配 3 GB 内存 (CL_DEVICE_MAX_MEM_ALLOC_SIZE)。当我尝试加载大小超过 3 GB 的向量时,pro...

回答 1 投票 0

AMD RDNA3指令名称解读

我正在尝试分析为 RDNA3 AMD GPU 编译的 OpenCL 内核。 为此,我使用 Radeon GPU 分析器。 当我在分析器中加载 OpenCL 内核时,它会显示汇编指令...

回答 2 投票 0

安装 vortex 时出现 libhwloc.so.5 错误

安装所有依赖项后在 vortex 中尝试“make”时,出现以下错误: /usr/bin/ld:警告:/opt/pocl/runtime/lib/libOpenCL.so 需要的 libhwloc.so.5,未找到(尝试

回答 1 投票 0

OpenCL 的函数 clGetPlatformInfo 运行时问题。 Win10、VS2012

我的硬件是 Intel Core I7 6700、32 GB RAM、Nvidia GT1030。我的软件是Windows 10 64位,Visual Studio 2012 professional。我买了《OpenCL并行编程开发手册》这本书。

回答 1 投票 0

使用 Imagination IMG GPU 清除 OpenCL 缓冲区

我可以在 Intel、NVIDIA 和 AMD GPU 上使用 clEnqueueFillBuffer() 成功清除 OpenCL 缓冲区对象。 当我尝试在 Imagination IMG GPU 上执行相同操作时,我的程序出现段错误。 它可能...

回答 1 投票 0

链接器找不到 clGetPlatformIDs()?

我正在尝试使用 AMD OCL SDK 编译一个简单的 OpenCL 测试程序: #包括 #包括 int main() { cl_platform_id 平台; cl_device_id 设备; c...

回答 1 投票 0

在opencl中如何在if/while块中同步线程

OpenCL 标准表示在 if/while 块内使用屏障会导致未定义的行为。但我不明白为什么在 if/while 块中同步线程是不可能的;分歧的三...

回答 2 投票 0

在哪里可以找到 rocprofiler 派生的计数器描述和示例

我的 opencl 内核花了太长时间才能完成,rocprof 给了我以下计数器: |索引 |内核名称 | GPU id |队列 ID |队列索引 | PID | tid | GRD |工作组 | LDS | SCR |拱_vgpr |累积...

回答 1 投票 0

C++ OpenCL 只找到 iGPU 但找不到 CPU

正如标题所示,OpenCL API 只检测我的 Intel iGPU,而不检测 CPU 本身。为什么有什么想法吗?我已经通过包管理器安装了 Intel-opencl-icd,但它似乎不是 e...

回答 1 投票 0

Intel GPU 上是否有等效的“扭曲尺寸”或“波前宽度”

在 Nvidia 上,将 CL_DEVICE_WARP_SIZE_NV 查询放入 clGetDeviceInfo 中,通常返回 32。 在 AMD 上,CL_DEVICE_WAVEFRONT_WIDTH_AMD 过去是 64,现在在更新的 AMD GP 上...

回答 1 投票 0

2D 前向 FFT 使用 clFFT 库不会产生结果

我想使用 clFFT 库执行 2D 实数到复数 FFT。输出数组只为实部和虚部保留零,这是不正确的(我有一个使用...实现的工作版本

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.