C 编译器优化 - 涉及算术的宏

Question

我正在与一位朋友讨论优化问题，需要一些帮助来找到这个问题的答案，并希望我可以进一步阅读一些官方文档。

我被告知，在生产构建设置中编译一个简单的程序时（即：

CCOPTS+=-O4

，无调试等），以下代码：

#define COEFFICIENT_F  (5.0f)
...
...
float f = 1.0f / COEFFICIENT_F;

...将自动优化为如下所示：

#define COEFFICIENT_F  (5.0f)
...
...
#define INV_COEFFICIENT_F (0.2f)
float f = 1.0f * INV_COEFFICIENT_F;

虽然，如果我正在编译调试版本（即

CCOPTS+=-O0 DEBUG=-g

），代码将不会在预处理器级别优化此类操作。

所以，我的问题有两个：

Answer 1

您的答案是：

Answer 2

这实际上取决于编译器的确切用法和具体情况。在您给出的确切示例中，编译器必须非常愚蠢才能弄清楚

1.0f/5.0f = 0.2f

，就像

1.0f*0.2f = 0.2f

一样（好吧，在这两种情况下，结果可能是

0.1999996

或类似的东西。

现在，如果我们有一些编译器在编译过程中无法弄清楚的数据：

 float f[] = { 3.1415926f, 1.0f, 9.82f, 1.4142f };
 float res[4]; 

 for(int i = 0; i < 4; i++)
    res[i] = f[i] / COEFFICIENT_F;

与

 for(int i = 0; i < 4; i++)
    res[i] = f[i] * INV_COEFFICIENT_F;

它可能会带来一些差异（特别是在较低的优化级别中，因为优化器不会用其他数学运算替换简单的数学运算，直到您至少达到 -O2）。

这会产生多大的差异取决于处理器架构。

要找出确切的差异，您必须编写一个小程序并测量它。（虽然数量比四还多！）