opencl 相关问题

OpenCL(开放计算语言)是一个用于编写程序的框架,这些程序跨CPU,GPU和其他处理器组成的异构平台执行。

OpenCL 在尝试读取内核输出时永远挂起

这是 OpenCL 主机在微不足道的内核结果中耗尽内存的后续结果,在应用更正并出现另一个错误后,我发现我的程序在 EnqueueReadBuffer 中挂起......

回答 1 投票 0

使用 CUDA 计算数百个小矩阵的特征值/特征向量

我有一个关于使用 CUDA 对数百个小矩阵进行特征分解的问题。 我需要计算数百个(例如 500 个)小(64×64)实对称的特征值和特征向量

回答 2 投票 0

有关为 Android 设备构建 CLBlast 和 OpenCL 的一些问题

我在做什么 我正在使用 JNI 编写 Android 应用程序,并且想使用 CLBlast 加速 C++ 代码。 背景 我已阅读 https://github.com/CNugteren/CLBlast 中的 Android 指南,并且知道我必须这样做

回答 1 投票 0

计算单元、SMX、CUDA 核心等之间有什么关系?

我对这些术语很困惑...我知道 nVidia GPU 有一些流式多处理器 (SMX),每个处理器由多个 CUDA 核心(流式处理器,SP)组成。然而...

回答 1 投票 0

OpenCL 主机在琐碎的内核中内存不足

我正在尝试在一个示例学习程序中使用内核,该程序具有 1024 个输入缓冲区条目和输出缓冲区两个 32 位浮点条目数组。 https://anteru.net/blog/2012/gett...

回答 1 投票 0

GPU 编程、CUDA 或 OpenCL 还是? [已关闭]

GPU 编程的最佳方法是什么? 我知道: CUDA 非常好,有很多开发人员支持和非常好的 zo 调试,但仅限于 NVidia 硬件 OpenCL 非常灵活,可以在 NVidia、AMD 和

回答 1 投票 0

opencl命令队列是如何工作的,我能要求它做什么

我正在研究一种算法,它可以多次执行几乎相同的操作。由于该操作由一些线性代数(BLAS)组成,我想我会尝试使用 GPU 来完成此操作。 我已经...

回答 2 投票 0

OpenCL 检测错误

我是 Adobe Premiere 和 GPU 加速的新手。我开始遵循使用 Premiere Pro CC 编辑视频的简单教程,当我将鼠标悬停在视频上时,几秒钟后出现“停止工作”错误...

回答 2 投票 0

Opencl 工作项和流处理器

工作项和流处理器(cuda core)之间有什么关系?我在某处读到,工作项的数量应该大大超过核心的数量,否则,就没有性能......

回答 2 投票 0

这个 GPU 计算或着色器模式叫什么(如果有的话)?

首先,请注意,这同样可以应用于编写 GPGPU 代码的图形着色器,尽管我的兴趣是 GPGPU,这就是示例代码“类似计算”的原因。 我们都知道G...

回答 1 投票 0

在 OpenCL 中将整数转换为浮点数

这是我关于堆栈溢出的第一篇文章,所以请耐心等待。 我目前正在编写 OpenCL 内核并需要使用内置 sqrt 函数。然而,要使其发挥作用,

回答 1 投票 0

JOCL CL_OUT_OF_RESOURCES 仅当已分配值时

我目前正在 OpenCL 中开发 sha256 内核。如果我通过内核向内核写入值,我将无法读取内核的输出。如果我不向变量写入任何值,则代码...

回答 1 投票 0

如何使用 OpenCL C++ API 获取设备 cl_device_id

我开始使用 OpenCL C++ API。我已经使用 C API 很长时间了。 C++ API 更加优雅、简单,代码更少且不易出错,但我需要设备 ID。我...

回答 1 投票 0

在 OpenCL 内核中使用模板化结构作为参数

我遇到了一个问题,如果您能帮助我解决问题,我将非常感激。 我尝试使用 clang-17 编译下面看到的代码片段,但出现错误:

回答 1 投票 0

OpenCL 大数取模

我正在尝试在 OpenCL 中计算 mod b,其中 a 是 ulong 元素的数组,并且是 b 长度的两倍。 __kernel void mod(__global ulong *a, __global ulong *b, __global ulong 长度) { ...

回答 2 投票 0

完整的 .NET OpenCL 实现 [已关闭]

我一直在寻找,但运气不佳。 OpenCL 是否有任何有据可查的 .NET 绑定实现? (如果有必要的话,我会为 CUDA 采取一些措施)。 我遇到过各种各样的情况

回答 7 投票 0

有没有办法在OpenCl中加载大小等于GPU全局内存大小的向量?

我的 GPU 有 12 GB 全局内存 (CL_DEVICE_GLOBAL_MEM_SIZE),但只能分配 3 GB 内存 (CL_DEVICE_MAX_MEM_ALLOC_SIZE)。当我尝试加载大小超过 3 GB 的向量时,pro...

回答 1 投票 0

AMD RDNA3指令名称解读

我正在尝试分析为 RDNA3 AMD GPU 编译的 OpenCL 内核。 为此,我使用 Radeon GPU 分析器。 当我在分析器中加载 OpenCL 内核时,它会显示汇编指令...

回答 2 投票 0

安装 vortex 时出现 libhwloc.so.5 错误

安装所有依赖项后在 vortex 中尝试“make”时,出现以下错误: /usr/bin/ld:警告:/opt/pocl/runtime/lib/libOpenCL.so 需要的 libhwloc.so.5,未找到(尝试

回答 1 投票 0

OpenCL 的函数 clGetPlatformInfo 运行时问题。 Win10、VS2012

我的硬件是 Intel Core I7 6700、32 GB RAM、Nvidia GT1030。我的软件是Windows 10 64位,Visual Studio 2012 professional。我买了《OpenCL并行编程开发手册》这本书。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.