我试图更好地理解堆栈和堆是如何工作的。 在比较同一程序的 32 位和 64 位编译版本时,我遇到了一个障碍。 在这两种情况下,我都使用了 guest Fedora 15 VM(32 位和 64 位)、gcc 用于编译、gdb 用于调试以及相同的主机硬件。 该程序非常简单,如下所示:
###C 程序
void function(int a, int b, int c, int d){
int value;
char buffer[10];
value = 1234;
buffer[0] = 'A';
}
int main(){
function(1, 2, 3, 4);
}
为了节省篇幅,我省略了程序的汇编转储;但是,如果有人认为这可以帮助他们回答我的问题,我很乐意将其包括在内。
###32位编译程序:
参数 4 (0xbffff3e4)、3 (0xbffff3e0)、2 (0xbffff3dc) 和 1 (0xbffff3d8) 首先被压入堆栈。 接下来,函数()调用之后的指令位置(或返回地址)被放置在堆栈上(0x080483d1)。 接下来,前一个堆栈的基指针的值 (0xbffff3e8) 被压入堆栈。
(gdb) x/16xw $esp
0xbffff3c0: 0x00000000 0x410759c3 0x4105d237 0x00000000
0xbffff3d0: 0xbffff3e8 0x080483d1 0x00000001 0x00000002//pointers
0xbffff3e0: 0x00000003 0x00000004 0x00000000 0x4105d413//followed by params
0xbffff3f0: 0x00000001 0xbffff484 0xbffff48c 0x41040fc4
###64位编译程序:
但是;这里看不到值 4、3、2 和 1。 无论我查看堆栈的多远,我所能看到的都是返回地址(0x4004ae)和前一个堆栈帧的基指针(0x7fffffffe210)。
(gdb) x/16xg $rsp
0x7fffffffe200: 0x00007fffffffe210 0x00000000004004ae //pointers
0x7fffffffe210: 0x0000000000000000 0x00000036d042139d
0x7fffffffe220: 0x0000000000000000 0x00007fffffffe2f8
0x7fffffffe230: 0x0000000100000000 0x0000000000400491
0x7fffffffe240: 0x0000000000000000 0x7ade47f577d82f75
0x7fffffffe250: 0x0000000000400390 0x00007fffffffe2f0
0x7fffffffe260: 0x0000000000000000 0x0000000000000000
0x7fffffffe270: 0x8521b80ab3982f75 0x7ab3e77151682f75
###带有打印语句的64位编译程序:
现在,添加简单的打印语句后:
printf("%d, %c\n", flag, buffer[0]);
在 function() 中,我可以看到任性的参数(见下文,0x7fffffffe1e0-0x7fffffffe1ec)。 我还可以看到前一个堆栈帧的基指针 0x7fffffffe210(在 0x7fffffffe200 中)和返回地址 0x400520(在 0x7fffffffe208 中)。 我相信它是由于新的打印声明而改变的。为什么在这种情况下,如果没有 print 语句,4、3、2 和 1 是不可见的? gcc 编译器的 64 位实现是否足够智能,不会“浪费”从未使用过的参数和局部变量的内存?
(gdb) x/16xg $rsp
0x7fffffffe1e0: 0x0000000300000004 0x0000000100000002 //parameters
0x7fffffffe1f0: 0x0000000000000000 0x00000000004003e0
0x7fffffffe200: 0x00007fffffffe210 0x0000000000400520 //pointers
0x7fffffffe210: 0x0000000000000000 0x00000036d042139d
0x7fffffffe220: 0x0000000000000000 0x00007fffffffe2f8
0x7fffffffe230: 0x0000000100000000 0x0000000000400503
0x7fffffffe240: 0x0000000000000000 0xd3c0c92559feaed9
0x7fffffffe250: 0x00000000004003e0 0x00007fffffffe2f0
更高。 为什么 64 位操作系统将参数lower放置在堆栈中而不是所述指针?我的印象是传递的参数总是首先放置在堆栈中(因此,将位于更大值的内存地址中)因为堆栈向较小的地址增长)。然后是保存的基指针和返回地址(因此基指针可以重置为其先前的值,并且可以返回调用函数)。 这是我在 32 位编译代码中观察到的行为,但不是 64 位版本。 我有什么误解吗? 我很感激对此事的任何见解,如果我的问题不清楚,我深表歉意。 请让我知道任何可以更简洁的方式(或者如果我在任何时候实际上不正确)。
在添加 printf()
%rdi
、
%rsi
、
%rdx
,
%rcx
、
%r8
、
%r9
)。
添加
printf()
后,它们可能会在寄存器内容为 printf()
调用而打乱的过程中保存在堆栈上 - 看一下程序集;一旦您知道 ABI 是什么样子,它可能就很明显了。