avx 相关问题

Advanced Vector Extensions（AVX）是针对Intel和AMD微处理器的x86指令集架构的扩展。

无法从Intel i7 930 CPU上的源代码编译TensorFlow； GTS-250 GPU

我是TF的新手，由于我的台式机没有支持AVX指令的CPU或GPU，因此希望从源代码进行编译。我的系统具有Intel i7 930处理器（nehalem家族的Bloomfield）...

tensorflow compiler-errors bazel avx

回答 1 投票 0

SSE / AVX是否提供确定结果是否舍入的方法？

x87 FPU状态字中C1位的目的之一是显示是否将不精确的结果四舍五入。 SSE / AVX是否为标量操作提供任何此类指示？我没有...

x86 rounding sse simd avx

回答 1 投票 4

如何在Java中使用Intel AVX？

如何使用Java中的Intel AVX向量指令集？这是一个简单的问题，但答案似乎很难找到。

java simd avx

回答 5 投票 6

AVX2 SIMD Instrinsics 16位到8位反之亦然

我有一个c ++（或类似c的）函数，在该函数之下我尝试向量化。该函数是图像合成的多种变体之一，它采用具有色度444的Y，U或V图像平面...

c++ simd intrinsics avx avx2

回答 1 投票 4

当行大小大于矢量宽度时，SIMD转置

您会找到很多很好的答案，用于转置随SIMD指令集的自然大小而下降的矩阵，特别是在一行的大小不超过矢量宽度的情况下。 ...

matrix transpose simd avx avx2

回答 2 投票 1

向量矩阵乘法，浮点向量，二进制矩阵

我想将大小为N的浮点向量与大小为NxM的矩阵相乘。矩阵是二进制矩阵（仅包含零和1），并且相对稀疏：非零值的密度在1％到5％之间...

c++ matrix-multiplication sse simd avx

回答 1 投票 0

为什么使用SIMD指令时，这个简单的C ++ SIMD基准测试运行速度较慢？

[我正在考虑编写SIMD向量数学库，因此，作为一个快速基准测试，我编写了一个程序，该程序执行1亿个（按4个浮点数）矢量逐元素乘法，并将它们加到累加的总数中。...]] >

c++ performance simd intrinsics avx

回答 1 投票 0

SIMD，SSE，AVX-掩码8由未签名的字符浮起来？

如何通过无符号char变量中的位屏蔽__m256变量中的8个浮点数？（编译期间未知）__m256 flts = _mm256_set1_ps（5.0f）; unsigned char = 0b10010111; // ...

c++ sse intrinsics avx

回答 1 投票 0

如何解决AVX加载/存储操作的32字节对齐问题？

我在使用ymm寄存器时遇到对齐问题，其中一些代码片段对我来说似乎很好。这是一个最小的工作示例：#include #include ...

c++ c++11 sse memory-alignment avx

回答 3 投票 11

Centos 7.7上的Vscode无法识别Intel AVX功能，有关__mm256i的错误

我想通过在项目中包含库来使用一些avx2函数；但是，Vscode似乎无法识别这些功能，因为它表明我的项目包含各种...

visual-studio-code avx avx2

回答 1 投票 0

获得GCC以32位代码（-m32）使用AVX吗？

我有一个C程序，该程序只能在要编译代码的Ivy Bridge CPU上运行，在gcc 4.8上，我尝试使用-march = native进行编译，以利用CPU的所有特定指令。我...

c linux gcc compiler-optimization avx

回答 2 投票 2

使用gcc的x86编译c程序不使用AVX指令集

我有一个C程序，该程序只能在要编译代码的Ivy Bridge CPU上运行，在gcc 4.8上，我尝试使用-march = native进行编译，以利用CPU的所有特定指令。我...

c linux optimization avx gcc4.8

回答 2 投票 1

GCC为什么要在我的机器上创建额外的组装说明？

自从我开始使用SSE / AVX内在函数以来已经有一段时间了。我最近开始为矩阵转置编写标题。我使用了很多if constexpr分支，以便编译器...

c++ gcc intrinsics avx

回答 1 投票 0

当使用带AVX-512负载和存储掩码寄存器，是提高了无效故障访问屏蔽掉元素？

当我做一个writemasked AVX-512店，像这样：vmovdqu8 [RSI] {K1}，ZMM0请问指令错，如果在访问的存储器的某些部分[RSI，RSI + 63]没有被映射，但写掩码是零。 ..

x86 avx avx512

回答 1 投票 7

YASM：vmovaps指令造成分段错误

问题：MOVAPS是给我分割故障。背景：X86-64运算指令vmovaps设计与AVX使用上的酷睿i系列处理器（这我运行此系统注册...

assembly nasm x86-64 simd avx

回答 1 投票 1

什么是执行使用SIMD指令的任意128/256/512位重排列最快的方法？

我想执行单位，对位的，和半字节（4位）上的CPU寄存器宽度128，256或512位的（XMM，YMM或个zmm）的任意排列;这应该是尽可能快。 ...

c++ assembly sse avx avx2

回答 1 投票 11

我tensorflow /核心/平台/ cpu_feature_guard.cc：137]你的CPU支持，这TensorFlow二进制编译时不使用说明：SSE4.1 SSE4.2 [复制]

我在基于CPU的系统中安装了tensorflow使用命令：PIP安装tensorflow == 安装完成后没有任何错误和一些初步核查的一部分，我能...

python tensorflow pip sse avx

回答 1 投票 0

如何在_mm256_shuffle_epi8意义在这个游戏中生命的实施？

使我的功课实现使用内部函数康威生命游戏找到工作的代码，但无法理解它的主要部分。此实现首先计算量...

c++ intrinsics avx conways-game-of-life

回答 1 投票 1

英特尔编译器无法识别来自海湾合作委员会” avxintrin.h标识符

我试图让我的项目AVX指令。我可以用gcc（GCC -mavx）建造它，但不与英特尔的编译器（ICPC -maxv）的失败与以下错误avxintrin.h GCC头：无...

c++ gcc avx icc

回答 1 投票 1

错误：内联无法调用always_inline

我试图在一些文件上实现和编码，其中一些文件包含SIMD调用。我已经在服务器上编译了这段代码，运行与我的机器基本相同的操作系统，但我无法编译它。这是 ...

c++ gcc makefile simd avx

回答 1 投票 0

avx 相关问题

最新问题