图解简单C程序的运行时结构

2019-04-11 本文已影响11人 MARIOW

程序在内存中的存储分为三个区域，分别是动态数据区、静态数据区和代码区。函数存储在代码区，全局变量以及静态变量存储在静态数据区，而在程序执行的时候才会在动态数据区产生数据。程序执行的本质就是代码区的指令不断执行，驱使动态数据区和静态数据区产生数据变化。

图解简单C程序的运行时结构

代码区与动态数据区由三个寄存器控制，分别是eip、ebp和esp。eip指向代码区下一个要执行的指令，ebp与esp分别指向动态数据区的栈底和栈顶。初始情况下eip默认指向main函数的第一条指令，esp、ebp指向的位置由程序加载时内核的设置决定。

图解简单C程序的运行时结构

我们看一下这段代码如何执行的，在执行第一条指令时，考虑到函数调用的问题，ebp会先把当前指向的地址记录到栈中，方便以后返回来继续执行。把地址压进栈时，esp就会自动往栈顶方向移动。说到这里，为避免混淆先科普一下什么是栈顶和栈底，栈只允许在一端做插入和删除操作，这一端就叫栈顶，而另一端叫做栈底，图中下方叫栈顶，上方叫栈底。esp永远在栈顶，也就是图的最下方。

图解简单C程序的运行时结构

由于esp指向的地址已经被记录，那么它就被空闲出来了。现在我们开始构建main函数的栈，空闲的esp帮忙看着main函数的栈底。这个时候esp与ebp是重叠的。

图解简单C程序的运行时结构

eip继续指向下一条指令，到了局部变量i的初始化，这里将i赋值为4，就将i的初始值压到栈中，esp继续往栈顶移动。下一条指令与本条相同，将局部变量j也压入栈中，如图所示。

图解简单C程序的运行时结构

接下来调用了fun函数，虽然fun函数是独立的函数，但是由于是在main函数中调用的，所以依然将数据压至main函数的栈中。fun函数的传入参数为i、j，但是入栈的顺序正好相反，b先入栈，然后a被压入栈中，如图所示。

图解简单C程序的运行时结构

接下来要跳转到fun函数了，在跳转之前，我们要先给fun函数的返回值留个位置，因为要赋值给局部变量m的。然后再将fun函数的返回地址压入栈中，方便执行完fun函数后能继续往下执行。最后再把ebp当前的地址值压入栈中，此时ebp指向的是main函数的栈底（如果这里不做保存，fun函数执行完ebp就回不去了）。