我正在与一位朋友讨论优化问题,需要一些帮助来找到这个问题的答案,并希望我可以进一步阅读一些官方文档。
我被告知,在生产构建设置中编译一个简单的程序时(即:
CCOPTS+=-O4
,无调试等),以下代码:
#define COEFFICIENT_F (5.0f)
...
...
float f = 1.0f / COEFFICIENT_F;
...将自动优化为如下所示:
#define COEFFICIENT_F (5.0f)
...
...
#define INV_COEFFICIENT_F (0.2f)
float f = 1.0f * INV_COEFFICIENT_F;
虽然,如果我正在编译调试版本(即
CCOPTS+=-O0 DEBUG=-g
),代码将不会在预处理器级别优化此类操作。
所以,我的问题有两个:
您的答案是:
没有。预处理按照标准中的定义进行,不受任何优化级别的影响。
你所说的优化并不是在预处理时进行的,而是在从前端到代码生成器的漫长道路上进行的。
这实际上取决于编译器的确切用法和具体情况。在您给出的确切示例中,编译器必须非常愚蠢才能弄清楚
1.0f/5.0f = 0.2f
,就像1.0f*0.2f = 0.2f
一样(好吧,在这两种情况下,结果可能是0.1999996
或类似的东西。
现在,如果我们有一些编译器在编译过程中无法弄清楚的数据:
float f[] = { 3.1415926f, 1.0f, 9.82f, 1.4142f };
float res[4];
for(int i = 0; i < 4; i++)
res[i] = f[i] / COEFFICIENT_F;
与
for(int i = 0; i < 4; i++)
res[i] = f[i] * INV_COEFFICIENT_F;
它可能会带来一些差异(特别是在较低的优化级别中,因为优化器不会用其他数学运算替换简单的数学运算,直到您至少达到 -O2)。
这会产生多大的差异取决于处理器架构。
要找出确切的差异,您必须编写一个小程序并测量它。 (虽然数量比四还多!)