“奇数大小的对齐向量上的“安全” SIMD算法？

Question

比方说，我有一些16字节对齐的结构，只包装3xFloat32数组：

#[repr(C, align(16))]
pub struct Vector(pub [f32; 3]);

现在，我想将其划分为两个实例，例如：

use core::arch::x86_64;

let a = Vector([1f32, 2f32, 3f32]);
let b = Vector([4f32, 5f32, 6f32]);
let mut q = Vector([0f32, 0f32, 0ff32]);

unsafe {
    let a1 = x86_64::_mm_load_ps(a.0.as_ptr());
    let b1 = x86_64::_mm_load_ps(b.0.as_ptr());
    let q1 = x86_64::_mm_div_ps(a1, b1);
    x86_64::_mm_store_ps(q.0.as_mut_ptr(), q1);
}

它可以进行除法，但是存在一个问题：第4个元素包含垃圾，除其他外，这可能表示NaN。并且，如果未屏蔽某些例外标志，则将触发SIGFPE。我想以某种方式避免这种情况，而不会完全沉默信号。即我或者只想在第4对元素上使其静音，或者在其中添加一些合理的值。最好，最快的方法是什么？还是总体上有更好的方法？

Answer 1

[像在C语言中一样，在Rust中，sizeof始终是alignof的倍数：这是必须的，因为sizeof用作数组中的stride

，并且数组元素需要正确对齐。

“奇数大小的对齐向量上的“安全” SIMD算法？

问题描述投票：5回答：2

2个回答

在垃圾元素中避免subnormals

通常避免在SIMD中使用水平填充。 SIMD vec！=几何vec。

免费获取零

最新问题

“奇数大小的对齐向量上的“安全” SIMD算法？

问题描述 投票：5回答：2

2个回答

在垃圾元素中避免subnormals

通常避免在SIMD中使用水平填充。 SIMD vec！=几何vec。

免费获取零

最新问题

问题描述投票：5回答：2