sse 相关问题

v。 Gopal等。 “使用PCLMULQDQ指令进行通用多项式的快速CRC计算。” 2009。http：//www.intel.com/content/dam/www/public/us/en/documents/white-papers/fast-crc-compont--compoint-generic-polynomials-pclmulqdq-paper.pdf

sse crc32 modular-arithmetic galois-field

回答 2 投票 0

INTEL X86_64组件比较签名的双精度浮标

inxmm0寄存器我有一个值，例如

assembly x86-64 intel precision sse

回答 1 投票 0

如何正确地将_mm_hadd_epi32转换为等效的C ++代码（WASM_SIMD128.H）使用Emscripten？

webassembly simd sse emscripten

回答 1 投票 0

有没有办法利用所有XMM寄存器？

这里是一个代码片段，用于计算取自浮点数组中的值的平方根 http://felix.abecassis.me/2011/09/cpp-getting-started-with-sse/ void sse(浮点* a, int N) { // 我们假设 N %...

c++ c sse

回答 2 投票 0

如何使用 SIMD 优化单元宽度测量（找到 8x8 字节块中具有非零字节的第一列）

我有一种算法，通过计算从单元格起始位置到其中仅包含零的第一列的距离来测量位图 (128x128) 中每个单元格 (8x8) 的宽度。如果有的话...

c x86-64 simd sse avx

回答 1 投票 0

如何使用 SIMD 优化单元宽度测量

我有一种算法，通过计算从单元格起始位置到其中仅包含零的第一列的距离来测量位图 (128x128) 中每个单元格 (8x8) 的宽度。如果有的话...

c x86-64 simd sse avx

回答 1 投票 0

值得使用 SSE 还是我应该只依赖编译器？

我正在研究非常棒的SSE指令，并开始使用一些简单的代码来测量使用它们的函数与使用“标准”代码（即非...

c++ optimization intel sse

回答 2 投票 0

为什么 x86 ldmxcsr/stmxcsr 采用内存操作数？

在 x86 中，无法直接从通用寄存器设置或存储 MXCSR 寄存器。强制编码寄存器操作数会导致#UD。当主要用户...

assembly x86 cpu-architecture sse

回答 1 投票 0

使用英特尔处理器加速 CRC32b

最近在研究CRC32计算加速的问题，是针对CRC32b类型（多项式0x04C11DB7）的，但是发现Intel的SSE4.2中的crc32指令ar...

x86 intel sse crc32

回答 1 投票 0

PCLMULQDQ 快速 crc 的位反映常数

我对白皮书“使用 PCLMULQDQ 指令对通用多项式进行快速 CRC 计算”中如何计算位反射常数感到困惑。在快速 CRC 后

sse crc

回答 1 投票 0

使用 C/C++ 在同一个可执行文件中进行不同的优化（普通、SSE、AVX）

我正在开发 3D 计算的优化，现在我有：使用标准 C 语言库的“普通”版本，使用预处理器 #define U 进行编译的 SSE 优化版本...

c++ c sse avx

回答 3 投票 0

为什么 .NET 使用 SIMD 而不是 x87 来进行非 SIMD 固有的数学运算？

这首先是好奇心的问题。我正在查看这段代码反汇编（C#，64 位，发布模式，VS 2012 RC）：双a = 10d * Math.Log(20d, 2d); 000000c8月...

.net assembly simd sse x87

回答 1 投票 0

如何从破坏列表中“修复‘asm’中未知的寄存器名称‘%xmm1’”？

我正在尝试为 Ubuntu 14.04 X86 构建一个项目，但出现以下错误：错误：“asm”中未知的寄存器名称“%xmm1” asm 易失性 ( ^ 错误：未知寄存器 na...

c gcc x86 sse inline-assembly

回答 1 投票 0

为什么我的应用程序无法达到 core i7 920 峰值 FP 性能

我对我的酷睿 i7 920 的 FP 峰值性能有疑问。我有一个应用程序执行大量 MAC 运算（基本上是卷积运算），但我无法达到峰值 FP

c intel sse

回答 4 投票 0

sse 相关问题

最新问题