C语言到汇编-函数与程序结构2

2020-04-14 本文已影响0人故事观察日记

这章的知识点有：

1.函数的定义
2.函数的声明
3.作用域
4.头文件
5.静态变量
6.寄存器变量
7.程序块结构
8.初始化
9.递归
10.C预处理器

上一篇学习了1.函数的定义，实际上也使用到了2.函数的声明。上一篇示例代码如下：

#include <stdio.h>

int a = 'a';
int b = 15;
int c = 17;

int f(int,int,int);

main(){
    f(a,b,c);
}

int f(int a,int b,int c)
{
    int x = a;
    int y = b;
    int z = c;
    print("%d", x);
    print("%d", y);
    print("%d", z);
    return x;
}

其中下面这一行就是函数f 的声明：

int f(int,int,int);

编译成汇编代码后，汇编代码中并没有体现函数声明的语句。也就是说，加不加这条函数声明，编译后的汇编代码没有区别。那声明语句被编译成什么了呢？这里先留个疑问，等后面学习了更多有关预处理和编译的知识后再来解答。
下面看第3个内容“作用域”：

3.作用域
4.头文件
5.静态变量
6.寄存器变量
7.程序块结构
8.初始化
9.递归
10.C预处理器

程序可以看成是变量定义和函数定义的集合。那么作用域指的也即变量与函数的作用域。变量又分为局部变量（也叫自动变量）和全局变量（也叫外部变量），它们的作用域也不相同。

局部变量的作用域：声明该变量的函数。
外部变量的作用域：从声明它的地方开始，到其所在的（待编译的）文件的末尾结束；
函数参数的作用域：可以看作局部变量，其作用域与局部变量相同；
函数本身的作用域：函数默认是外部的，其作用域与外部变量相同。

上一篇的示例代码中也使用了局部变量和外部变量以及函数和参数，可以从对上一篇示例代码编译后的汇编代码的分析中来理解它们的作用域。
上一篇的C语言示例代码本篇开头已贴出，再来看看对应的汇编代码：

    .file   "function.c"
    .intel_syntax
.globl _a
    .data  /*.data通知as汇编后续语句，将它们追加在编号为0的数据段末。*/
    .align 4
_a:
    .long   97
.globl _b
    .align 4
_b:
    .long   15
.globl _c
    .align 4
_c:
    .long   17
    .def    ___main;    .scl    2;  .type   32; .endef
    .text  /*通知as把后续语句汇编到编号为0的子段。*/
.globl _main
    .def    _main;  .scl    2;  .type   32; .endef
_main:
    push    ebp
    mov ebp, esp
    sub esp, 24
    and esp, -16
    mov eax, 0
    add eax, 15
    add eax, 15
    shr eax, 4
    sal eax, 4
    mov DWORD PTR [ebp-4], eax
    mov eax, DWORD PTR [ebp-4]
    call    __alloca
    call    ___main
    mov eax, DWORD PTR _c
    mov DWORD PTR [esp+8], eax
    mov eax, DWORD PTR _b
    mov DWORD PTR [esp+4], eax
    mov eax, DWORD PTR _a
    mov DWORD PTR [esp], eax
    call    _f
    leave
    ret
    .section .rdata,"dr"
LC0:
    .ascii "%d\0"
    .text  /*通知as把后续语句汇编到编号为0的子段。*/
.globl _f
    .def    _f; .scl    2;  .type   32; .endef
_f:
    push    ebp
    mov ebp, esp
    sub esp, 24
    mov eax, DWORD PTR [ebp+8]
    mov DWORD PTR [ebp-4], eax
    mov eax, DWORD PTR [ebp+12]
    mov DWORD PTR [ebp-8], eax
    mov eax, DWORD PTR [ebp+16]
    mov DWORD PTR [ebp-12], eax
    mov eax, DWORD PTR [ebp-4]
    mov DWORD PTR [esp+4], eax
    mov DWORD PTR [esp], OFFSET FLAT:LC0
    call    _print
    mov eax, DWORD PTR [ebp-8]
    mov DWORD PTR [esp+4], eax
    mov DWORD PTR [esp], OFFSET FLAT:LC0
    call    _print
    mov eax, DWORD PTR [ebp-12]
    mov DWORD PTR [esp+4], eax
    mov DWORD PTR [esp], OFFSET FLAT:LC0
    call    _print
    mov eax, DWORD PTR [ebp-4]
    leave
    ret
    .def    _print; .scl    2;  .type   32; .endef

可以看到，代码的第4行“.data”指令，将后面几行中的a、b、c 三个外部变量存入了数据段内存中，它们在程序运行的整个过程中都是存在且可以访问的。
而在代码中的_main 函数和_f 函数之前都有“.text”指令，该指令将_main 函数和_f 函数的代码存入了另一个内存段中，它们也是随时可以访问的。
而函数的参数以及函数内部声明的局部变量x、y、z 在上面的代码中是没有姓名的，只有当程序执行到函数内对应的位置时，它们才以[esp+8]、[ebp-4] 这样的形式被分配内存，在函数执行期间，它们的值是存在且可以被访问的，参考上一篇中的表格2：

表格2

而当函数执行结束并返回后，表格2中的esp、ebp 的值也被释放，变成了函数调用前的值，所以在表格2这段内存栈中存放的局部变量x、y、z 的值也无法再被访问。
以上就是对作用域的相关分析，下面继续向下学习。

4.头文件
5.静态变量
6.寄存器变量
7.程序块结构
8.初始化
9.递归
10.C预处理器

4.头文件内容可能很多，放到下一篇，接下来看5.静态变量和6.寄存器变量。示例代码：

#include <stdio.h>

static char buf[100]; 

main(){ 
    static int bufp = 7;
    register int x = 3; 
    x = x + 1;
    printf("%d", x);
}

这段代码定义了一个外部静态变量buf ，一个局部静态变量bufp 和一个寄存器变量x ，编译后的汇编代码如下：

    .file   "function.c"
    .intel_syntax
    .def    ___main;    .scl    2;  .type   32; .endef
    .data
    .align 4
bufp.0:
    .long   7
    .section .rdata,"dr"
LC0:
    .ascii "%d\0"
    .text
.globl _main
    .def    _main;  .scl    2;  .type   32; .endef
_main:
    push    ebp
    mov ebp, esp
    sub esp, 24
    and esp, -16
    mov eax, 0
    add eax, 15
    add eax, 15
    shr eax, 4
    sal eax, 4
    mov DWORD PTR [ebp-4], eax
    mov eax, DWORD PTR [ebp-4]
    call    __alloca
    call    ___main
    mov eax, 3
    inc eax
    mov DWORD PTR [esp+4], eax
    mov DWORD PTR [esp], OFFSET FLAT:LC0
    call    _printf
    leave
    ret
.lcomm _buf,112
    .def    _printf;    .scl    2;  .type   32; .endef

两段代码相关语句对比：

static char buf[100]; 
static int bufp = 7;
register int x = 3;

bufp.0:
    .long   7
_main:
    mov eax, 3
    ret
.lcomm _buf,112  /*为一个本地通用符号symbol预留length个字节的内存。因为symbol没有被声明为全局性的符号，所以symbol对ld通常不可见。*/
    .def    _printf;    .scl    2;  .type   32; .endef

可以看到，外部静态变量buf 没有了.globl 描述符，所以作用域仅在当前文件。
而定义在main 函数内部的局部变量bufp ，也拥有了姓名，其值在程序运行期间一直存在，但只能被定义它的函数使用。
寄存器变量x 确实存在了寄存器eax 中，而不是像之前一样存入栈内存中。
也可以用static 来声明函数，函数默认是外部的，用static 声明后变为静态的，作用域仅在当前文件中。
了解了静态变量和函数与非静态之间的区别后，继续学习下面的内容。

4.头文件
7.程序块结构
8.初始化
9.递归
10.C预处理器

由于7.程序块结构只是一些概念，8.初始化前面的代码中也有涉及，不再举例。下面来看9.递归的示例代码：

#include <stdio.h>

int f(int);
main(){ 
    f(10);
}

int f(int x){
    x--;
    if(x > 0){
        printf("%d\n", x);
        f(x);
    }
}

编译后的汇编关键代码：

_main:
    mov DWORD PTR [esp], 10
    call    _f
    leave
    ret
    .section .rdata,"dr"
LC0:
    .ascii "%d\12\0"
_f:
    push    ebp
    mov ebp, esp
    sub esp, 8
    dec DWORD PTR [ebp+8]
    cmp DWORD PTR [ebp+8], 0
    jle L3
    mov eax, DWORD PTR [ebp+8]
    mov DWORD PTR [esp+4], eax
    mov DWORD PTR [esp], OFFSET FLAT:LC0
    call    _printf
    mov eax, DWORD PTR [ebp+8]
    mov DWORD PTR [esp], eax
    call    _f
L3:
    leave
    ret

可见，递归在汇编中即在子函数中调用自身，结合上一篇的分析以及表格2可以得出，每调用一次函数自身，栈空间都会向上拓展一段（本例中是8个内存单元，指令“sub esp,8”），用来存放本次函数运行需要用到的参数及局部变量的值；每返回一次，相应的释放一段栈内存空间（表格2中栈指针寄存器esp 向下移动），直到整个递归结束。
其实，递归的过程与上一篇分析的在函数_main 中调用函数_f 并返回的过程没什么不同，只是调用的函数由其它函数变成了自身而已。
好了，这次先学到这里，还剩下头文件和预处理器两个内容，一起留到下一篇。

C语言到汇编-函数与程序结构2

猜你喜欢

热点阅读