C/C++程序中标识符（变量名和函数名）存哪了？

2018-01-05 本文已影响0人 FlyingReganMian

要回答上述问题，必须首先了解这样一个问题“我们写的代码是如何被计算执行的？”。
　　这就涉及到了程序的编译和装载。这里我们简单的说一下大致流程，代码首先要经过编译器（gcc/g++）编译链接后生成可执行文件，随后系统将可执行文件加载到内存，接下来CPU从内存中读取指令，数据等信息执行该程序。
　　从以上流程中，我们可以看出我们的代码经历了三个阶段：代码---》可执行文件----》进程（运行着的程序）。我们先给出正确答案：标识符只存在与代码和可执行程序阶段，在进程阶段是不存在的（也就是说在内存中不存在标识符）。
　　众所周知代码文件中肯定存在标识符。

1. 可执行文件中的标识符

接下来，我们分析可执行程序中是否存在标识符？首先我们了解一下可执行程序大致的文件结构。（详细内容请看https://www.jianshu.com/p/a9dfd55792e7）

目标文件详细内容与结构.jpg
在可执行文件中，标识符存储在了.shstrtab中
.shstrtab: 字符串表。在ELF文件中用到了很多字符串，比如段名，变量名等。当 ELF 文件的其它部分需要引用字符串时，只需提供该字符串在字符串表中的位置索引即可。

这样做的目的就是为了调试程序，因此我们可以在调试器中看到标识符与其值之间的对应关系。

２.标识符是否会被加载到内存中？

答案当然是表示符不会加载到内存中。首先，先看一段代码

int g(int x)
{
    return x + 2017;
}

编译后：

g:
.LFB0:
  .cfi_startproc
  pushl   %ebp
  .cfi_def_cfa_offset 8
  .cfi_offset 5, -8
  movl    %esp, %ebp
  .cfi_def_cfa_register 5
  movl    8(%ebp), %eax
  addl    $2017, %eax
  popl    %ebp
  .cfi_restore 5
  .cfi_def_cfa 4, 4
   ret
  .cfi_endproc
.LFE0:
  .size   g, .-g
  .globl  f
  .type   f, @function

以“.”开头的行代表链接有关的代码，删除后是：

g:
    pushl   %ebp
    movl    %esp, %ebp
    movl    8(%ebp), %eax
    addl    $2017, %eax
    popl    %ebp
    ret

查看这一看：

 movl    8(%ebp), %eax

这一行就表示将ｘ从栈里取出来放在eax中。X的表示形式为栈址（%ebp）加偏移量。根本没有出现x（g其实也是不存在的，这只是个tag，为了简写汇编程序的。变成机器码后就相当于没有g了）

总结：标识符的根本就是不存在的啊，这些标识符就是栈址 + 偏移的形式。

C/C++程序中标识符（变量名和函数名）存哪了？

1. 可执行文件中的标识符

２.标识符是否会被加载到内存中？

猜你喜欢

热点阅读