opencl 相关问题

OpenCL（开放计算语言）是一个用于编写程序的框架，这些程序跨CPU，GPU和其他处理器组成的异构平台执行。

OpenCL中的设备内存对象地址是否自动对齐？

这里是示例代码：__kernel void my_kernel（__ global float * src，__global float * dst）{float4 a = vload4（0，src）; //对...做某事... vstore4（a，0，dst）} ...

opencl gpgpu memory-alignment

回答 1 投票 0

使用opencl进行快速光栅化

我正在使用opencl编写用于实时3d渲染的光栅化器。我当前的体系结构：顶点着色器：每个顶点光栅化器1个线程：每个面1个线程，这些线程循环遍历...

opengl graphics opencl rasterizing

回答 1 投票 -1

openCL错误结果

有人可以解释一下为什么会这样吗？我坚信它将增加我的数组的值。 #include #pragma comment（lib，“ OpenCL.lib”）#include const std :: string ...

opencl

回答 1 投票 1

如何将OpenCl库链接到Clion IDE

我正在使用Clion中的opencl库编写HellowWorld示例。我的问题是问题是我收到了错误消息[50％]链接CXX可执行文件HelloWorldOpencl / usr / lib64 / gcc / x86_64-suse-linux / ...

c++ opencl

回答 1 投票 0

编译警告OpenCL Matrix Multplication

为什么不进行向量化？ __attribute __（（（num_simd_work_items（4）））__attribute __（（num_compute_units（2）））__attribute __（（reqd_work_group_size（16,16,1）））__kernel void matrix_multiplication（const ...

parallel-processing opencl pyopencl

回答 1 投票 1

OpenCL中的BLAS / LAPACK库

我通过使用OpenCL库在GPU中执行了矩阵矩阵乘法。结果并不令人满意，我认为使用某些库ccan可以提高效率。我想知道BLAS / LAPACK ...

gpu opencl gpgpu lapack blas

回答 1 投票 0

如何更改OpenCL缓冲区的大小？

我想使用OpenGL + OpenCL模拟粒子系统。在我要更改粒子数之前，它工作正常。我创建了包含质量/速度/位置三元组的缓冲区。 ...

opencl

回答 1 投票 0

使用uchar *代替image2d_t的OpenCL

首先...我不是OpenCL的专家。我正在使用2个内核。第一个内核的输出是image2d_t，但是第二个内核的输入是“ __global const uchar * source”。 __kernel void ...

opencl

回答 1 投票 2

是否可以将异步回调/继续附加到SYCL内核？

我有数千个SYCL内核要执行。这些内核中的每一个完成后，我需要在由所述内核写入的cl :: sycl :: buffer上执行一个函数。我正在使用的方法...

opencl gpgpu sycl

回答 1 投票 1

用CMake> = 3.14表示使用OpenCL的“正确方法是什么？”>

cmake opencl

回答 1 投票 0

根据OpenCL中的设备内存确定最大全局工作组大小？

我能够根据设备内存列出以下有助于限制设备工作项的参数：CL_DEVICE_GLOBAL_MEM_SIZE CL_DEVICE_LOCAL_MEM_SIZE ...

opencl

回答 1 投票 6

在OpenCL库中找不到cl :: Error类

我在一些代码中看到OpenCL库中有一个名为cl :: Error的类，通过它可以捕获OpenCL代码中的错误和错误类型。但是当我在代码中添加内容时，就像这样#include

c++ error-handling opencl

回答 1 投票 0

OpenCL内核批量实现im2col

我正在尝试将为CPU编写的安全功能调整为适用于GPU的OpenCL内核。该功能是许多深度学习应用程序中使用的众所周知的im2col。我在...

c image-processing deep-learning opencl

回答 1 投票 0

从OpenCL中的GPU编程中获取初始值

我开发了一个小代码，通过OpenCL库使用GPU添加两个小向量。主要代码vectorAdd.cc如下：#include #include #include ＃... ] >>

c++ gpu opencl nvidia

回答 2 投票 0

AVX2和AVX-512有什么区别？

就SIMD和并行化而言，AVX2和AVX-512有什么区别？他们是同一件事还是不同？我只是看到double8用于AVX-512，而double4用于AVX2？我...

opencl simd avx

回答 1 投票 0

使用OpenCL优化而不是多处理池映射

在我的代码的第一个版本中，我使用了python的Multiprocessing库，该库应用于16个线程的主函数MAIN_LOOP上，如下所示：def MAIN_LOOP（lll，seed = None）：global aa global ...

numpy gpu opencl python-multiprocessing pyopencl

回答 1 投票 -1

OpenCl中的多线程

我已经开始研究OpenCl，并且对工作组和内核的工作原理有一些基本的了解。假设我的向量大小为1024，GPU的WorkGroupSize为256。所以我的WorkGroupSize ...

multithreading multiprocessing opencl opencl-c

回答 1 投票 0

如何从数组中获得一个求和数组

我是openCL的新手。我知道如何求和一维数组。但是我的问题是如何从openCL中的1个1D数组中获取一个sum数组。 int a [1000]; int b [1000]; .... //将数据保存到for（...

opencl

回答 2 投票 3

用于压缩缓冲区的快速算法

我正在执行图像压缩。图像I被分解为K个代码块{Bi}。每个块具有固定大小的MxN像素。每个块被独立压缩。所有压缩块{Ci}，...

opencl

回答 4 投票 1

为什么float4会以前缀和执行浮点运算

[在OpenCL中，马修·斯卡皮诺（Matthew Scarpino）评论说，将其前缀和从32位浮点数转换为4位浮点数的128位集合会带来显着的性能提高，几乎提高了4倍...

performance opencl gpu

回答 1 投票 0

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.