编译器忽略运算符的新分配

Question

我正在用C ++编程512位整数。对于整数，我使用new关键字从堆中分配内存，但编译器（MINGW上的g ++版本8.1）似乎错误地优化了它。即编译器命令是：

g++ -Wall -fexceptions -Og -g -fopenmp -std=c++14 -c main.cpp -o main.o

g++ -o bin\Debug\cs.exe obj\Debug\main.o -O0 -lgomp

码：

#include <iostream>
#include <cstdint>
#include <omp.h>

constexpr unsigned char arr_size = 16;
constexpr unsigned char arr_size_half = 8;
void exit(int);

struct uint512_t{
    uint32_t * bytes;
    uint512_t(uint32_t num){
        //The line below is either (wrongfully) ignored or (wrongfully) optimized out
        bytes = new(std::nothrow) uint32_t[arr_size];
        if(!bytes){
            std::cerr << "Error - not enough memory available.";
            exit(-1);
        }
        *bytes = num;
        for(uint32_t * ptr = bytes+1; ptr < ptr+16; ++ptr){
            //OS throws error 0xC0000005 (accessing unallocated memory) here
            *ptr = 0;
        }
    }
    uint512_t inline operator &(uint512_t &b){
        uint32_t* itera = bytes;
        uint32_t* iterb = b.bytes;
        uint512_t ret(0);
        uint32_t* iterret = ret.bytes;
        for(char i = 0; i < arr_size; ++i){
            *(iterret++) = *(itera++) & *(iterb++);
        }
        return ret;
    }

    uint512_t inline operator =(uint512_t &b){
        uint32_t * itera=bytes, *iterb=b.bytes;
        for(char i = 0; i < arr_size; ++i){
            *(itera++) = *(iterb++);
        }
        return *this;
    }
    uint512_t inline operator + (uint512_t &b){
        uint32_t * itera = bytes;
        uint32_t * iterb = b.bytes;
        uint64_t res = 0;
        uint512_t ret(0);
        uint32_t *p2ret = ret.bytes;
        uint32_t *p2res = 1+(uint32_t*)&res;
        //#pragma omp parallel for shared(p2ret, res, p2res, itera, iterb, ret) private(i, arr_size) schedule(auto)
        for(char i = 0; i < arr_size;++i){
            res = *p2res;
            res += *(itera++);
            res += *(iterb++);
            *(p2ret++) = (i<15) ? res+*(p2res) : res;
        }
        return ret;
    }
    uint512_t inline operator += (uint512_t &b){
        uint32_t * itera = bytes;
        uint32_t * iterb = b.bytes;
        uint64_t res = 0;
        uint512_t ret(0);
        uint32_t *p2ret = ret.bytes;
        uint32_t *p2res = 1+(uint32_t*)&res;
        //#pragma omp parallel for shared(p2ret, res, p2res, itera, iterb, ret) private(i, arr_size) schedule(auto)
        for(char i = 0; i < arr_size;++i){
            res = *p2res;
            res += *(itera++);
            res += *(iterb++);
            *(p2ret++) = (i<15) ? res+(*p2res) : res;
        }
        (*this) = ret;
        return *this;
    }
    //uint512_t inline operator * (uint512_t &b){
    //}
    ~uint512_t(){
        delete[] bytes;
    }
};

int main(void){
    uint512_t a(3);
}

Answer 1

ptr < ptr+16总是如此。循环是无限的，并最终溢出它写入的缓冲区。

简单的解决方案：Value初始化数组，以便您不需要循环：

bytes = new(std::nothrow) uint32_t[arr_size]();
//                                          ^^

PS。如果复制实例，则行为将是未定义的，因为副本将指向相同的分配，并且两个实例都会尝试在析构函数中删除它。

简单的解决方案：不要使用裸拥有指针。如果需要动态分配数组，请使用std::vector等RAII容器。

PPS。首先要仔细考虑是否需要动态分配（以及相关的开销）。在许多情况下，512位是相当安全的就地。

Answer 2

错误发生在这一行，与new被优化无关：

for(uint32_t * ptr = bytes+1; ptr < ptr+16; ++ptr){
    *ptr = 0;
}

for的条件是错误的。 ptr < ptr+16永远不会是假的。循环将永远持续下去，最终你将取消引用无效的内存位置，因为ptr会无限增加ad-infinitum。

顺便说一下，允许编译器执行优化，但不允许改变程序的表观行为。如果你的代码执行new，编译器可以优化它，如果它可以确保new的副作用在你需要时（在这种情况下你访问数组时）。

Answer 3

您正在访问数组越界。最小的可重复的例子是：

#include <cstdint>
int main() {
        uint32_t bytes[16];
        for(uint32_t * ptr = bytes + 1; ptr < ptr + 16; ++ptr){
            //OS throws error 0xC0000005 (accessing unallocated memory) here
            *ptr = 0;
        }
}

ptr < ptr + 16总是正确的（可能除了溢出）。

Answer 4

p.s我尝试了你的解决方案，它工作正常 -

bytes = new(std::nothrow) uint32_t[arr_size];
    if(!bytes){
        std::cerr << "Error - not enough memory available.";
        exit(-1);
    }
    *bytes = num;
    auto ptrp16 = bytes+16;
    for(uint32_t * ptr = bytes+1;ptr < ptrp16 ; ++ptr){
        *ptr = 0;
    }

编译器忽略运算符的新分配

问题描述投票：0回答：4

4个回答

最新问题

编译器忽略运算符的新分配

问题描述 投票：0回答：4

4个回答

最新问题

问题描述投票：0回答：4