opencl 相关问题

OpenCL(开放计算语言)是一个用于编写程序的框架,这些程序跨CPU,GPU和其他处理器组成的异构平台执行。

如何在程序内部在 OpenCL 中启动多个内核?

我正在尝试查看 Opencl 编程模型在 GPU 上的性能,现在在测试编程模型时,我必须使用 clEnqueueNDkernel() 来启动内核,我尝试调用它

回答 1 投票 0

Openclatomic_add()函数返回错误值

我在 OpenCL 1.2 中遇到问题。 看,我在内核中有一个 __global 数组,组大小为 1000。 问题是atomic_add() 函数无法正常工作。 我的内核代码是:

回答 1 投票 0

什么是银行冲突? (进行Cuda/OpenCL编程)

我一直在阅读CUDA和OpenCL的编程指南,但我不明白什么是银行冲突。他们只是深入研究如何解决问题,而不详细说明主题

回答 5 投票 0

OpenCL 中逐元素矩阵乘法速度

我编写了一个小型 OpenCL 应用程序,用于计算两个矩阵的乘积。现在我注意到,如果矩阵的大小超过 8192 x 8192,则会出现显着的性能下降(计算...

回答 1 投票 0

使用AMD GPU时,YOLO输出使用什么平台?

被这个问题折磨了很长时间,请问你的建议是往哪个方向移动。目标 - 在 Windows 上使用 yolo 开发通用应用程序,可以使用 AMD/Nvidia/Int...的计算能力

回答 2 投票 0

OpenCL:for 循环中的 CL_OUT_OF_RESOURCES

我正在尝试执行 OpenCL,但它给了我一个 CL_OUT_OF_RESOURCES。情况如下: 我正在测试 100 个工作项,因此我将 global_sizes 和 local_sizes 设置为 100。 我创建了一份令状...

回答 2 投票 0

通过 OpenCL 加速 intel CORE i7 处理器

假设我有一台没有任何监视器的服务器计算机,并且有一个算法在其上运行(进程)。我可以通过使用 OpenCL 来提高算法的性能吗

回答 1 投票 0

AMD OpenCL 降低寄存器压力

我正在内核中运行排序算法,排序部分使用了大约36 VGPR,从而导致12.5%的占用率和糟糕的性能。 代码段如下: 类型定义结构{ 佛罗里达...

回答 3 投票 0

在 AMD 上从 ArrayFire 到 OpenGL?

是否可以使用 AMD 显卡在 ArrayFire 和 OpenGL 之间来回切换? 有一篇文章介绍了如何使用 CUDA 来做到这一点。关于对 OpenCL 使用类似方法的任何提示,因此可以使用...

回答 2 投票 0

AMD OpenCL 致命错误:CL/cl.hpp:没有这样的文件或目录

我正在尝试在 Visual Studio 2015 中使用 C++ 中的 OpenCL 在 Windows 7 上编译一个简单的“hello world”程序。尝试构建时,我收到此错误: 无法打开包含文件:'CL/cl.hpp':...

回答 1 投票 0

AMD Tahiti 上的 OpenCL / OpenGL 隐式同步

我在 AMD Tahiti(AMD Radeon HD 7900 系列)设备上遇到 OpenCL 和 OpenGL 的“隐式同步”问题。该设备具有 cl/gl 扩展、cl_khr_gl_sharing、...

回答 1 投票 0

将 async_work_group_copy() 与指针一起使用?

__kernel void kmp(__global char pattern[1*4], __global char* string, __global int 失败[1*4], __global int ret[1], int g_length、int l_length、int thread_num...

回答 1 投票 0

OpenCL Sinus 实施

我正在寻找 OpenCL Sinus 实现。 嗯,我知道,OpenCL 实现是特定于硬件供应商的,因此 Nvidia OpenCL 实现可能看起来与 AMD 不同。但是...

回答 1 投票 0

在 AMD Radeon 上尝试使用 OpenCL+Theano 时出现“pygpu 已配置但无法导入”错误

我已按照以下说明进行操作: https://gist.github.com/jarutis/ff28bca8cfb9ce0c8b1a 但是当我尝试时: THEANO_FLAGS=device=opencl0:0 python test.py 在测试文件中我得到了 e...

回答 2 投票 0

在 OpenCL 内核中使用 printf 的问题

我在 AMD 上使用 OpenCL 2.0。代码非常简单。如果我使用 1 个 printf,效果会很好。但是如果我添加第二个printf,那么就会出现错误的数据。 我在主机 C++ 中的代码: cl_int 错误代码; // 获取

回答 3 投票 0

OpenCL 内核和传统循环

我正在研究OpenCL,我不明白C/C++代码中的传统循环与内核代码之间的关系。 只是为了弄清楚这样的情况: 所以我的问题是:在传统...

回答 1 投票 0

AMD 的 GCN 和 VEGA 指令集中的 V_SUB_F64

为什么AMD的GCN和VEGA指令集中没有V_SUB_F64指令?他们是如何实现双精度减法的?

回答 1 投票 0

我应该如何开始 OpenCL 编程?

我应该为 opencl 安装哪些软件? 适用于英特尔处理器。 操作系统:Windows 11。 好吧,告诉我所有软件的名称。 如果有人能告诉我 opencl 的资源,我将不胜感激

回答 1 投票 0

OpenCL 中的工作项分支分歧,它是如何工作的?

我正在研究有关OpenCL的一些东西,我不太理解“工作项分歧或发散控制流”的概念。 正如我们在下图中看到的,有一些...

回答 1 投票 0

在 ubuntu 16.04 中安装适用于 AMD 的 OpenCL

我想使用 OpenCL 为我的项目进行一些 GPU 计算。 但我在安装它时遇到了一些麻烦。 首先,我不知道如何为我的视频安装合适的驱动程序

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.