avx 相关问题

Advanced Vector Extensions(AVX)是针对Intel和AMD微处理器的x86指令集架构的扩展。

__m256未知类型(铿锵5.1 / i5 CPU)?

我刚开始尝试内在函数。我设法使用Clang 5.1在Mac上使用__m128成功编译程序。这台Mac上的CPU是英特尔酷睿i5 M540。当我试图编译时......

回答 1 投票 1

Xcode Apple Clang启用avx512

在Xcode(版本10.1(10B61))中,我使用如下的Macro来检测AVX512支持。 #ifdef __SSE4_1__ #error“sse4_1”#endif #ifdef __AVX__ #error“avx”#endif #ifdef __AVX2__ #error“avx2”#endif#...

回答 1 投票 1

为什么GCC的AVX速度较慢而LLVM速度更快?

我想更好地理解为什么两个非常相似的代码片段在我的计算机上表现得截然不同。这些测试是在Ryzen处理器上使用gcc-trunk和Julia 0.7-alpha(LLVM ...

回答 1 投票 10

Simd matmul程序给出了不同的数值结果

我正在尝试使用simd内在函数在C中编程矩阵乘法。我非常确定我的实现,但是当我执行时,我从...的第5位开始得到一些数值错误。

回答 1 投票 4

在使用new []分配的阵列上使用avx时出现分段错误(核心转储)

当我在visual studio 2015中运行此代码时,代码可以正常工作。但代码在代码块中生成以下错误:分段错误(核心转储)。我也在ubuntu中使用相同的代码运行代码...

回答 2 投票 2

英特尔芯片上的半精度浮点运算

是否可以在英特尔芯片上执行半精度浮点运算?我知道如何加载/存储/转换半精度浮点数[1]但我不知道如何添加/乘法...

回答 2 投票 5

在glibc(LD_HWCAP_MASK,/ etc / lt.so.nohwcap)中禁用AVX优化函数以获取valgrind和gdb记录

带有glibc的现代x86_64 linux将检测到CPU支持AVX扩展,并将许多字符串函数从通用实现切换到AVX优化版本(借助ifunc ...

回答 4 投票 12

是否有针对AVX指令编译的TensorFlow版本?

我试图在我的Chromebook上获取TensorFlow,而不是最好的地方,我知道,但我只是想了解它。我在Python开发环境或任何开发环境中都没有做太多工作......

回答 2 投票 19

使用SSE / AVX本体论时的体系结构效应

我想知道编译器如何处理内在函数。如果使用SSE2 Intrinsics(使用#include )并使用-mavx标志进行编译。编译器将生成什么?它会产生AVX还是......

回答 2 投票 1

在CPU中禁用AVX2以进行测试

我有一个需要AVX2正常工作的应用程序。如果CPU具有AVX2指令,则执行检查以在应用程序启动期间进行检查。我想检查它是否正常工作,但我......

回答 1 投票 8

将浮动从高xmm四字移动到低xmm四字

MOVHPD将xmm寄存器的高四字提取到存储器中。 PEXTRQ提取xmm寄存器的高位四字,并将其放入整数寄存器(仅整数)。 SHUFPD洗牌。 ...

回答 1 投票 1

避免AVX-SSE(VEX)过渡处罚

我们的64位应用程序有很多代码(特别是在标准库中),它们在SSE模式下使用xmm0-xmm7寄存器。我想使用ymm寄存器实现快速内存复制。我不能修改......

回答 5 投票 1

AVX2:分配给__m256i类成员时出现分段错误

我目前正在重构一个命令式的C ++程序,该程序将AVX2原语广泛用于结构良好的基于 类的程序。不幸的是,我在分配课程时遇到了段错误......

回答 1 投票 1

您的CPU支持未编译此TensorFlow二进制文件的指令:AVX AVX2

我是TensorFlow的新手。我最近安装了它(Windows CPU版)并收到以下消息:成功安装tensorflow-1.4.0 tensorflow-tensorboard-0.4.0rc2然后当我...

回答 6 投票 490

为什么_mm_permute_ps的最后一个参数是int?

GCC告诉我,SIMD内在_mm_permute_ps的最后一个参数必须是8位立即数。那么为什么它的最后一个参数被声明为期望一个int? __m128 _mm_permute_ps(...

回答 1 投票 2

将8个字符从内存加载到__m256变量中作为压缩单精度浮点数

我正在优化图像上的高斯模糊算法,我想用下面的代码替换__m256内部变量中浮点缓冲区[8]的用法。什么系列的指令是最好的......

回答 1 投票 5

编译AVX2程序

我用AVX内在函数编写了一个程序,它使用Ubuntu 12.4 LTS和GCC 4.6以及以下编译行很好地工作:g ++ -g -Wall -mavx ProgramName.cc -o ProgramName问题...

回答 2 投票 1

如何检查CPU是否支持SSE3指令集?

以下代码是否有效以检查CPU是否支持SSE3指令集?使用IsProcessorFeaturePresent()函数显然不适用于Windows XP(请参阅http://msdn.microsoft.com / ...

回答 5 投票 58

用不同的值SIMD移动4个整数

SSE没有提供一种以可变数量移动打包整数的方法(我可以使用任何AVX和更旧的指令)。你只能做统一的轮班。我试图为每个人实现的结果......

回答 1 投票 5

有效地使用英特尔编译器SVML`__m128 _mm_sincos_ps()`

我有一个简单的循环:for(ii = 0; ii <numRows * numCols; ii ++){mCOmega [ii] = cosf(paramOmega * mI [ii]); mSOmega [ii] = sinf(paramOmega * mI [ii]);我想要...

回答 1 投票 1

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.