汇编中的函数调用与递归

栈帧的结构

 

  假若咱们要想搞清楚过程的实现,就必须先知道栈帧的结构是如何构成的。栈帧其实能够认为是程序栈的一段,而程序栈又是存储器的一段,所以栈帧说到底仍是存储器的一段。那么既然是一段,确定有两个端点,这个不须要LZ再普及了吧。web

  这两个端点其实就是两个地址,一个标识着起始地址,一个标识着结束地址,而这两个地址,则分别存储在固定的寄存器当中,即起始地址存在%ebp寄存器当中,结束地址存在%esp寄存器当中。至于为何要存在这两个寄存器当中,就像程序的下一条指令地址为何存在PC当中同样,是毫无心义的问题,就是这样规定的,没有为何。函数

  起始地址和结束地址还有另外的名字,起始地址一般称为帧指针,结束地址一般称为栈指针(也就是栈顶的地址)。所以,咱们就把过程的存储器内存使用区域称为栈帧。这下咱们就了解了栈帧的来历以及它们的命名习惯和存储惯例,接下来是LZ画的一幅图,它揭示了栈帧在存储器当中的位置。优化

  这个图基本上已经包括了程序栈的构成,它由一系列栈帧构成,这些栈帧每个都对应一个过程,并且每个帧指针+4的位置都存储着函数的返回地址,每个帧指针指向的存储器位置当中都备份着调用者的帧指针。各位须要知道的是,每个栈帧都创建在调用者的下方(也就是地址递减的方向),当被调用者执行完毕时,这一段栈帧会被释放。还有一点很重要的是,%ebp和%esp的值指示着栈帧的两端,而栈指针会在运行时移动,因此大部分时候,在访问存储器的时候会基于帧指针访问,由于在一直移动的栈指针没法根据偏移量准确的定位一个存储器位置。this

  还有一点比较重要的内容,就是栈帧当中内存的分配和释放。因为栈帧是向地址递减的方向延伸,所以若是咱们将栈指针减去必定的值,就至关于给栈帧分配了必定空间的内存。这个理解起来很简单,由于在栈指针向下移动之后(也就是变小了),帧指针和栈指针中间的区域会变长,这就是给栈帧分配了更多的内存。相反,若是将栈指针加上必定的值,也就是向上移动,那么就至关于压缩了栈帧的长度,也就是说内存被释放了。须要注意的是,上面的一切内容,都基于一个前提,那就是帧指针在过程调用当中是不会移动的。spa

 

过程的实现

 

  过程虽然很好,但想要实现过程,仍是存在必定难度的,尽管如今看来它并不困难。它实现的难度主要就在于数据如何在调用者和被调用者之间传递,以及在被调用者当中局部变量内存的分配以及释放。指针

  不过天大的难题都难不倒那群计算机界的大神们,他们找出了一种方式,能够简单并有效的处理过程实现当中的难题。这一切彷佛看起来十分偶然,但其实也是必然的。世间的不少规律都是客观存在的,只是它在等着咱们去发现而已。code

  总的来讲,过程实现当中,参数传递以及局部变量内存的分配和释放都是经过以上介绍的栈帧来实现的,大部分状况下,咱们认为过程调用当中作了如下几个操做。orm

  一、备份原来的帧指针,调整当前的帧指针到栈指针的位置,这个过程就是咱们常常看到的以下两句汇编代码作的事情。blog

    pushl    %ebp
    movl    %esp, %ebp

  二、创建起来的栈帧就是为被调用者准备的,当被调用者使用栈帧时,须要给临时变量分配预留内存,这一步通常是通过下面这样的汇编代码处理的。递归

    subl    $16,%esp

  三、备份被调用者保存的寄存器当中的值,若是有值的话,备份的方式就是压入栈顶。所以会采用以下的汇编代码处理。

    pushl    %ebx

  四、使用创建好的栈帧,好比读取和写入,通常使用mov,push以及pop指令等等。

  五、恢复被调用者寄存器当中的值,这一过程实际上是从栈帧中将备份的值再恢复到寄存器,不过此时这些值可能已经不在栈顶了。所以在恢复时,大多数会使用pop指令,但也并不是必定如此。

  六、释放被调用者的栈帧,释放就意味着将栈指针加大,而具体的作法通常是直接将栈指针指向帧指针,所以会采用相似下面的汇编代码处理(也多是addl)。

    movl    %ebp,%esp

  七、恢复调用者的栈帧,恢复其实就是调整栈帧两端,使得当前栈帧的区域又回到了原始的位置。由于栈指针已经在第六步调整好了,所以此时只须要将备份的原帧指针弹出到%ebp便可。相似的汇编代码以下。

    popl    %ebp

  八、弹出返回地址,跳出当前过程,继续执行调用者的代码。此时会将栈顶的返回地址弹出到PC,而后程序将按照弹出的返回地址继续执行。这个过程通常使用ret指令完成。

  过程的实现大概就是以上八个步骤组成的,不过这些步骤并不都是必须的(大部分时候,开启编译器的优化会优化掉不少步骤),并且第6和第7步有时会使用leave指令代替。这里猿友们能够先了解一下这些步骤,在接下来的内容当中,还会有这几个步骤的详细示例。

 

过程相关指令:call、leave、ret

 

  因为过程调用当中会常常见到几个新的指令,所以在这里,LZ先给你们介绍一下这三个指令。它们三个都是过程实现当中很是重要的角色,这三个指令很相似,由于它们都是一个指令作了两件事,这里LZ就依次介绍一下它们各自都作了什么事。

  call指令:它一共作两件事,第一件是将返回地址(也就是call指令执行时PC的值)压入栈顶,第二件是将程序跳转到当前调用的方法的起始地址。第一件事是为了为过程的返回作准备,而第二件事则是真正的指令跳转。

  leave指令:它也是一共作两件事,第一件是将栈指针指向帧指针,第二件是弹出备份的原帧指针到%ebp。第一件事是为了释放当前栈帧,第二件事是为了恢复调用者的栈帧。

  ret指令:它一样也是作两件事,第一件是将栈顶的返回地址弹出到PC,第二件事则是按照PC此时指示的指令地址继续执行程序。这两件事其实也能够认为是一件事,由于第二件事是系统本身保证的,系统老是按照PC的指令地址执行程序。

  能够看出,除了call指令以外,leave和ret指令都与上面8个步骤有些不可分割的关系。call指令没有在8个步骤当中体现,是由于它发生在进入过程以前,所以在第1步发生的时候,call指令每每已经被执行了,而且已经为ret指令准备好了返回地址。

 

寄存器使用的规矩

 

  寄存器一共就8个,所以在数目上来讲的话,使用起来确定是捉襟见肘的。在这种状况下,就确定须要必定的规矩去约束程序如何使用,不然要是一群人翻同一我的的牌子,那到底伺候谁才是呢。其实咱们在以前已经或多或少的接触到了寄存器的规矩,好比%eax通常用于存储过程的返回值,%ebp保存帧指针,%esp保存栈指针。这里要介绍的,是另一个规矩,而这个规矩是与过程实现相关的。

  试想一下,在调用一个过程时,不管是调用者仍是被调用者,均可能更新寄存器的值。假设调用者在%edx中存了一个整数值100,而被调用者也使用这个寄存器,并更新成了1000,因而悲剧就发生了。当过程调用完毕返回后,调用者再使用%edx的时候,值已经从100变成了1000,这几乎必将致使程序会错误的执行下去。

  为了不上面这种状况发生,就须要在调用者和被调用者之间作一个协调。因而便有了这样的规矩,它的描述以下,咱们假设这里在过程P中调用了过程Q,P是调用者,Q是被调用者。

  %eax、%edx、%ecx:这三个寄存器被称为调用者保存寄存器。意思就是说,这三个寄存器由调用者P来保存,而对于Q来讲,Q能够随便使用,用完了就不用再管了。

  %ebx、%esi、%edi:这三个寄存器被称为被调用者保存寄存器。一样的,这里是指这三个寄存器由被调用者Q来保存,换句话说,Q可使用这三个寄存器,可是若是里面有P的变量值,Q必须保证使用完之后将这三个寄存器恢复到原来的值,这里的备份,其实就是上面那8个步骤中第3个步骤作的事情。

 

一个过程示例

 

  上面已经作好了充足的准备,接下来咱们就要探索真理了,咱们随便写一个调用过程的例子,LZ写了如下的代码来作这个十分重要的例子,咱们称它为function.c。

复制代码
int add(int a,int b){ register int c = a + b; return c; } int main(){ int a = 100; int b = 101; int c = add(a,b); return c; }
复制代码

  这里LZ为了完整的展示那8个步骤,所以给变量c加了register关键字修饰,这将会将c送入寄存器,从而更改被调用者保存寄存器,就会致使步骤3的发生。接下来咱们就使用参数-S来编译这段代码,而后使用cat来看看这段代码的汇编形式。如下是main函数以及add函数各自的栈帧状况,LZ已经详细标记了它们属于哪一个步骤。

  因为咱们没有使用编译优化,所以汇编代码会多出不少,这也为了完整的诠释咱们的步骤。能够看到,图中包含了完整的8个步骤,可是不管是main函数仍是add函数,它们单独来说,都没有完整的8个步骤,这实际上是大多数的状况。大部分时候,一个函数不会彻底包含上述的8个步骤。LZ这里再也不一一拆分各个步骤,各位猿友能够严格按照各个指令的做用,本身画图理解一下这个过程,答案自会浮现。

  LZ这里只说几点各位须要注意的地方,首先第一点是,add函数会将返回结果存入%eax(前提是返回值可使用整数来表示),在main函数中,call指令以后,默认将%eax做为返回结果来使用。第二点是,全部函数(包括main函数)都必须有第1步和第六、七、8步,这是必须的4步。最后一点是,咱们的栈指针和帧指针有固定的大小关系,即栈指针永远小于等于帧指针,当两者相等时,当前栈帧被认为没有分配内存空间。

  还有一点十分有趣的事情,注意main函数当中100和101的传递过程,是先进入存储器,而后再进去寄存器,而后再进去存储器,准备做为add函数的参数。这一来一回产生了四次寄存器与存储器之间的数据传输,假若咱们加上-O1参数去编译这个程序,编译器将产生以下的汇编代码。

  能够看到,整个main函数的指令数骤降,100和101将直接进入存储器,准备做为add函数的参数。可见编译器的优化当中至少会有一项,就是减小数据的来回传输,增长效率。不过这一点其实与过程的实现没有什么关系,只是让之前可能不知道的猿友看一下,编译器其实会将咱们的程序作很大的改动。

  

递归过程调用

 

  书中对递归调用还进行了说明,这是为了让咱们相信,栈帧的创建和销毁惯例,能够保证递归过程的正常运行。其实若是各位猿友愿意一点一点的,将上面main函数和add函数的汇编代码搞清楚,那么递归调用其实也能够很轻松的搞定。由于指令就这么多了,只要严格按照-S编译出的汇编指令,一步一步的推算寄存器和存储器的状态,那么递归调用的实现也会自动浮现。

  LZ这里准备给各位猿友诠释一下递归的过程,各位猿友能够对照着上面的示例看一下,如下是一段简单的求n的阶乘的代码。

复制代码
int rfact(int n){ int result; if(n<=1){ result = 1; }else{ result = n * rfact(n-1); } return result; }
复制代码

  接下来咱们编译一下这段代码,使用-O1优化,咱们能够获得以下的汇编代码。

  LZ在图中详细标注了各个步骤所作的事情,其实严格按照各个指令的做用分析,很轻松的就能够分析出图中的解释部分(即注释)。难点就在于,栈帧的变化是如何的,LZ这里就给各位演示一下栈帧的变化过程,若是各位已经把前面的那个main函数和add函数搞定了,那么能够在这里验证一下本身的理解是否正确。

  须要特殊说明的是,以上每个栈帧(大括号括起来的),最上面(也就是地址递增方向)的都是帧指针位置,最下面的都是栈指针位置。然而寄存器中只有%ebp和%esp保存栈帧指针,所以同一时间只能保存一对。当进展到第三层的时候,已经有了三个栈帧(原则上来说必定是多于3个),寄存器固然是存不下的,所以就须要在存储器当中备份一下,以后再恢复。因而就出现了每一个栈帧的帧指针指向的存储器位置,都会备份着外层方法(也就是调用者)的帧指针。

  当方法递归到n=1结束时,栈帧会自下向上依次收回,栈帧指针(也就是%ebp和%esp当中的值)都会依次向上移动,直到程序结束。也就是说,上面的三幅图,若是倒过来,就是递归方法依次结束时栈帧的状态。

  由此就能够看出,过程中栈帧创建以及完成的惯例,能够保证递归调用的正常运行,包括循环调用。不得不说,这群计算机界的大神们实在是太牛了,尽管当栈帧出现之后,看起来也并不复杂,但难点就在于无中生有的发现或者说某种意义上的创造。

 

做者:zuoxiaolong(左潇龙)

出处:博客园左潇龙的技术博客--http://www.cnblogs.com/zuoxiaolong

相关文章
相关标签/搜索