IA-32、IA-64 上哪种算术指令集运算最慢和最快?有排名吗?基准?
一般来说,这些是平方根和除法指令,特别适用于标量浮点管道。
对于 IA-32 和 IA-64,您可能需要查看 Intel(R) IA-64 和 IA-32 架构优化参考手册,其中在附录 C 中提供了不同处理器上每条指令的周期计数。您会发现,SIMD 等效指令的性能要好得多,但精度较低,而且它们一次可对 4 个元素进行操作。如果您需要更精确的平方根和倒数平方根,您必须通过额外的牛顿-拉夫森步骤手动执行此操作。
嗯,ADD 和 SUB 非常快。 任何“部分”浮点运算都会非常慢(这就是为什么它们是“部分”并且可能需要多次调用才能完成)。