我有一些使用 ARM Neon 内在函数(即 arm_neon.h)进行有限域算术加速的源代码。在树莓派上,我使用 gcc 和这样的参数来编译它们
-DARM_NEON64 -mfloat-abi-hard -mfpu=neon -O3
现在我想在 Macbook Pro (M3 Max) 上测试代码。我以前从未使用过 clang,不知怎的,我发现很难在谷歌上搜索到一个可行的编译命令来满足需要。有人可以提供有关这个主题的一些提示吗?感谢一个日志。 (没有 Xcode)
// foo.c
#include "arm_neon.h"
poly16x8_t foo(poly8x8_t a) { return vmull_p8(a,a);}
clang -c foo.c -O3
objdump -d foo.o
f.o: file format mach-o arm64
Disassembly of section __TEXT,__text:
0000000000000000 <ltmp0>:
0: 0e20e000 pmull.8h v0, v0, v0
4: d65f03c0 ret
-c
仅用于编译(目标文件.o
)。
我能想到的唯一障碍是是否正在配置
clang
(以某种方式通过环境变量)来生成 x64 代码。