opencl 相关问题

OpenCL(开放计算语言)是一个用于编写程序的框架,这些程序跨CPU,GPU和其他处理器组成的异构平台执行。

OpenCL中的设备内存对象地址是否自动对齐?

这里是示例代码:__kernel void my_kernel(__ global float * src,__global float * dst){float4 a = vload4(0,src); //对...做某事... vstore4(a,0,dst)} ...

回答 1 投票 0

使用opencl进行快速光栅化

我正在使用opencl编写用于实时3d渲染的光栅化器。我当前的体系结构:顶点着色器:每个顶点光栅化器1个线程:每个面1个线程,这些线程循环遍历...

回答 1 投票 -1

openCL错误结果

有人可以解释一下为什么会这样吗?我坚信它将增加我的数组的值。 #include #pragma comment(lib,“ OpenCL.lib”)#include const std :: string ...

回答 1 投票 1

如何将OpenCl库链接到Clion IDE

我正在使用Clion中的opencl库编写HellowWorld示例。我的问题是问题是我收到了错误消息[50%]链接CXX可执行文件HelloWorldOpencl / usr / lib64 / gcc / x86_64-suse-linux / ...

回答 1 投票 0

编译警告OpenCL Matrix Multplication

为什么不进行向量化? __attribute __(((num_simd_work_items(4)))__attribute __((num_compute_units(2)))__attribute __((reqd_work_group_size(16,16,1)))__kernel void matrix_multiplication(const ...

回答 1 投票 1

OpenCL中的BLAS / LAPACK库

我通过使用OpenCL库在GPU中执行了矩阵矩阵乘法。结果并不令人满意,我认为使用某些库ccan可以提高效率。我想知道BLAS / LAPACK ...

回答 1 投票 0

如何更改OpenCL缓冲区的大小?

我想使用OpenGL + OpenCL模拟粒子系统。在我要更改粒子数之前,它工作正常。我创建了包含质量/速度/位置三元组的缓冲区。 ...

回答 1 投票 0

使用uchar *代替image2d_t的OpenCL

首先...我不是OpenCL的专家。我正在使用2个内核。第一个内核的输出是image2d_t,但是第二个内核的输入是“ __global const uchar * source”。 __kernel void ...

回答 1 投票 2

是否可以将异步回调/继续附加到SYCL内核?

我有数千个SYCL内核要执行。这些内核中的每一个完成后,我需要在由所述内核写入的cl :: sycl :: buffer上执行一个函数。我正在使用的方法...

回答 1 投票 1


根据OpenCL中的设备内存确定最大全局工作组大小?

我能够根据设备内存列出以下有助于限制设备工作项的参数:CL_DEVICE_GLOBAL_MEM_SIZE CL_DEVICE_LOCAL_MEM_SIZE ...

回答 1 投票 6

在OpenCL库中找不到cl :: Error类

我在一些代码中看到OpenCL库中有一个名为cl :: Error的类,通过它可以捕获OpenCL代码中的错误和错误类型。但是当我在代码中添加内容时,就像这样#include

回答 1 投票 0

OpenCL内核批量实现im2col

我正在尝试将为CPU编写的安全功能调整为适用于GPU的OpenCL内核。该功能是许多深度学习应用程序中使用的众所周知的im2col。我在...

回答 1 投票 0

从OpenCL中的GPU编程中获取初始值

我开发了一个小代码,通过OpenCL库使用GPU添加两个小向量。主要代码vectorAdd.cc如下:#include #include #include #... ] >>

回答 2 投票 0

AVX2和AVX-512有什么区别?

就SIMD和并行化而言,AVX2和AVX-512有什么区别?他们是同一件事还是不同?我只是看到double8用于AVX-512,而double4用于AVX2?我...

回答 1 投票 0

使用OpenCL优化而不是多处理池映射

在我的代码的第一个版本中,我使用了python的Multiprocessing库,该库应用于16个线程的主函数MAIN_LOOP上,如下所示:def MAIN_LOOP(lll,seed = None):global aa global ...

回答 1 投票 -1

OpenCl中的多线程

我已经开始研究OpenCl,并且对工作组和内核的工作原理有一些基本的了解。假设我的向量大小为1024,GPU的WorkGroupSize为256。所以我的WorkGroupSize ...

回答 1 投票 0

如何从数组中获得一个求和数组

我是openCL的新手。我知道如何求和一维数组。但是我的问题是如何从openCL中的1个1D数组中获取一个sum数组。 int a [1000]; int b [1000]; .... //将数据保存到for(...

回答 2 投票 3

用于压缩缓冲区的快速算法

我正在执行图像压缩。图像I被分解为K个代码块{Bi}。每个块具有固定大小的MxN像素。每个块被独立压缩。所有压缩块{Ci},...

回答 4 投票 1

为什么float4会以前缀和执行浮点运算

[在OpenCL中,马修·斯卡皮诺(Matthew Scarpino)评论说,将其前缀和从32位浮点数转换为4位浮点数的128位集合会带来显着的性能提高,几乎提高了4倍...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.