OpenCL(开放计算语言)是一个用于编写程序的框架,这些程序跨CPU,GPU和其他处理器组成的异构平台执行。
我正在尝试调试我的OpenCL内核。我认为,错误是错误的内存分配。所以,我正在寻找一种方法来检测它。长话短说,我可以在POCL平台上运行OpenCL内核吗?
如何从N个固定长度字符串的缓冲区处理opencl内核中的字符串?
我需要在OpenCL设备上并行处理N个固定长度的字符串。处理字符串涉及调用所提供的函数,该函数将字符串作为表示为缓冲区的输入,...
我正在尝试编译一个opencl示例代码,但是我收到以下错误/ usr / bin / ld:找不到-lOpenCL / usr / bin / ld:找不到-loclUtil_x86_64 / usr / bin / ld:找不到 - .. 。
我正在尝试一个简单的helloWorld openCL代码,它编译没有错误但显示垃圾:╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠ ╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠错误功能在构建时检测到错误...
我正在使用OpenCL来优化Raspberry Pi GPU(Videocore IV)中的一些代码。我正在使用VC4CL实现,其最大工作组大小为12.但是,使用简单的内核,例如总结两个......
目前我尝试使用OpenCL实现FDTD-Method来解决麦克斯韦方程。该算法非常简单,从旧电场计算当前的h场并计算...
我应该如何处理:错误C2039'assign':在Visual Studio 2017中不是'cl :: string'的成员?
我想在Visual Studio C ++中构建一个简单的OpenCL代码,但在构建期间出错。错误是错误C2039'assign':不是'cl :: string'的成员问题是关于cl :: string。 ...
我有一个使用openCL的简单main.cpp文件。 (见最后)我在Windows 10 Linux子系统(Ubuntu 14)下使用bash为我(我想)更容易让事情变得更容易,所以我不必使用mingw或...
VideoCoreIV VC4CL(Raspberry Pi GPU)上的PyOpenCL性能问题
我是OpenCL / PyOpenCL的新手,我试图了解Raspberry GPU上的OpenCL(VideoCoreIV)与我的硬件上的向量和矩阵乘法中的Numpy(在CPU上)的比较。我正在使用VC4CL作为......
如果(离散)GPU有自己的视频RAM,我必须将我的数据从RAM复制到VRAM才能使用它们。但如果GPU与CPU集成(例如AMD Ryzen)并共享内存,我会......
我有以下openCL内核我想调试。我已经在其中放入了一些printf,但这些没有用,因为工作项是随机的计划,并且打印的值并不总是正确的。我怎么能让我......
我想知道如果Clojure有任何GPU集成库会怎么样?我已经看过这个涉及手动滚动OpenCL代码的例子,但我特别想找到类似于...的东西。
如何使用OSX在AMD GPU上获取OpenCL内核的汇编代码
我正在尝试查看在我的Mac的AMD GPU上运行的OpenCL内核的汇编代码。基于这个SO问题,OpenCL在线编译:从cl :: program或cl :: kernel获取程序集,我用...
在Julia中编写和调用ArrayFire的自定义C函数的正确方法
我在Julia工作,当我使用类似的代码时,我需要调用一些使用ArraFire库的自定义C函数:void copy(const af :: array&A,af :: array&B,size_t length){// 2。 ...
我正在使用经过优化的GPU驱动程序,可以使用16个元素的矢量数据类型。但是,我不确定如何正确使用它。我应该将它声明为例如主机上的cl_float16,大小为16 ...
我的TinkerBoard由基于ARM的Mali™-T764 GPU驱动。我正在运行Debian linaro v2.0.8 strech。我正在寻找OpenCL支持,如何使用OpenCL 1.2 FP启用GPU MALI?如果你 ...
我有RX580 GPU并在OpenCL中编写应用程序。我想进入OpenCL内核代码并进行调试。我已经为此安装了CodeXL,但是当我进行项目设置并设置休息时......
这里是OpenCL的新手。我正在尝试将我写入OpenCL的数值方法转换为加速。我正在使用PyOpenCL软件包,因为我已经在Python中编写了一次,并且尽我所能......
我试图在Adreno 630和我的笔记本电脑上运行OpenCL内核,结果发现内核在移动设备上运行完美,但每次都会崩溃我的笔记本电脑。我还在想弄清楚......
我是OpenCL的新手。我想编写一个通用内核,以后我可以将它的用途扩展到其他内存非合并模式,并将其与矩形模板模式配对以简化(...