avx 相关问题

Advanced Vector Extensions(AVX)是针对Intel和AMD微处理器的x86指令集架构的扩展。

无法从Intel i7 930 CPU上的源代码编译TensorFlow; GTS-250 GPU

我是TF的新手,由于我的台式机没有支持AVX指令的CPU或GPU,因此希望从源代码进行编译。我的系统具有Intel i7 930处理器(nehalem家族的Bloomfield)...

回答 1 投票 0

SSE / AVX是否提供确定结果是否舍入的方法?

x87 FPU状态字中C1位的目的之一是显示是否将不精确的结果四舍五入。 SSE / AVX是否为标量操作提供任何此类指示?我没有...

回答 1 投票 4

如何在Java中使用Intel AVX?

如何使用Java中的Intel AVX向量指令集?这是一个简单的问题,但答案似乎很难找到。

回答 5 投票 6

AVX2 SIMD Instrinsics 16位到8位反之亦然

我有一个c ++(或类似c的)函数,在该函数之下我尝试向量化。该函数是图像合成的多种变体之一,它采用具有色度444的Y,U或V图像平面...

回答 1 投票 4

当行大小大于矢量宽度时,SIMD转置

您会找到很多很好的答案,用于转置随SIMD指令集的自然大小而下降的矩阵,特别是在一行的大小不超过矢量宽度的情况下。 ...

回答 2 投票 1

向量矩阵乘法,浮点向量,二进制矩阵

我想将大小为N的浮点向量与大小为NxM的矩阵相乘。矩阵是二进制矩阵(仅包含零和1),并且相对稀疏:非零值的密度在1%到5%之间...

回答 1 投票 0

为什么使用SIMD指令时,这个简单的C ++ SIMD基准测试运行速度较慢?

[我正在考虑编写SIMD向量数学库,因此,作为一个快速基准测试,我编写了一个程序,该程序执行1亿个(按4个浮点数)矢量逐元素乘法,并将它们加到累加的总数中。...]] >

回答 1 投票 0

SIMD,SSE,AVX-掩码8由未签名的字符浮起来?

如何通过无符号char变量中的位屏蔽__m256变量中的8个浮点数? (编译期间未知)__m256 flts = _mm256_set1_ps(5.0f); unsigned char = 0b10010111; // ...

回答 1 投票 0

如何解决AVX加载/存储操作的32字节对齐问题?

我在使用ymm寄存器时遇到对齐问题,其中一些代码片段对我来说似乎很好。这是一个最小的工作示例:#include #include ...

回答 3 投票 11

Centos 7.7上的Vscode无法识别Intel AVX功能,有关__mm256i的错误

我想通过在项目中包含 库来使用一些avx2函数;但是,Vscode似乎无法识别这些功能,因为它表明我的项目包含各种...

回答 1 投票 0

获得GCC以32位代码(-m32)使用AVX吗?

我有一个C程序,该程序只能在要编译代码的Ivy Bridge CPU上运行,在gcc 4.8上,我尝试使用-march = native进行编译,以利用CPU的所有特定指令。我...

回答 2 投票 2

使用gcc的x86编译c程序不使用AVX指令集

我有一个C程序,该程序只能在要编译代码的Ivy Bridge CPU上运行,在gcc 4.8上,我尝试使用-march = native进行编译,以利用CPU的所有特定指令。我...

回答 2 投票 1

GCC为什么要在我的机器上创建额外的组装说明?

自从我开始使用SSE / AVX内在函数以来已经有一段时间了。我最近开始为矩阵转置编写标题。我使用了很多if constexpr分支,以便编译器...

回答 1 投票 0

当使用带AVX-512负载和存储掩码寄存器,是提高了无效故障访问屏蔽掉元素?

当我做一个writemasked AVX-512店,像这样:vmovdqu8 [RSI] {K1},ZMM0请问指令错,如果在访问的存储器的某些部分[RSI,RSI + 63]没有被映射,但写掩码是零。 ..

回答 1 投票 7

YASM:vmovaps指令造成分段错误

问题:MOVAPS是给我分割故障。背景:X86-64运算指令vmovaps设计与AVX使用上的酷睿i系列处理器(这我运行此系统注册...

回答 1 投票 1

什么是执行使用SIMD指令的任意128/256/512位重排列最快的方法?

我想执行单位,对位的,和半字节(4位)上的CPU寄存器宽度128,256或512位的(XMM,YMM或个zmm)的任意排列;这应该是尽可能快。 ...

回答 1 投票 11

我tensorflow /核心/平台/ cpu_feature_guard.cc:137]你的CPU支持,这TensorFlow二进制编译时不使用说明:SSE4.1 SSE4.2 [复制]

我在基于CPU的系统中安装了tensorflow使用命令:PIP安装tensorflow == 安装完成后没有任何错误和一些初步核查的一部分,我能...

回答 1 投票 0

如何在_mm256_shuffle_epi8意义在这个游戏中生命的实施?

使我的功课实现使用内部函数康威生命游戏找到工作的代码,但无法理解它的主要部分。此实现首先计算量...

回答 1 投票 1

英特尔编译器无法识别来自海湾合作委员会” avxintrin.h标识符

我试图让我的项目AVX指令。我可以用gcc(GCC -mavx)建造它,但不与英特尔的编译器(ICPC -maxv)的失败与以下错误avxintrin.h GCC头:无...

回答 1 投票 1

错误:内联无法调用always_inline

我试图在一些文件上实现和编码,其中一些文件包含SIMD调用。我已经在服务器上编译了这段代码,运行与我的机器基本相同的操作系统,但我无法编译它。这是 ...

回答 1 投票 0

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.