C/C++程序中标识符(变量名和函数名)存哪了?

2018-01-05  本文已影响0人  FlyingReganMian

要回答上述问题,必须首先了解这样一个问题“我们写的代码是如何被计算执行的?”。
  这就涉及到了程序的编译和装载。这里我们简单的说一下大致流程,代码首先要经过编译器(gcc/g++)编译链接后生成可执行文件,随后系统将可执行文件加载到内存,接下来CPU从内存中读取指令,数据等信息执行该程序。
  从以上流程中,我们可以看出我们的代码经历了三个阶段:代码---》可执行文件----》进程(运行着的程序)。我们先给出正确答案:标识符只存在与代码和可执行程序阶段,在进程阶段是不存在的(也就是说在内存中不存在标识符)。
  众所周知代码文件中肯定存在标识符。

1. 可执行文件中的标识符

接下来,我们分析可执行程序中是否存在标识符?首先我们了解一下可执行程序大致的文件结构。(详细内容请看https://www.jianshu.com/p/a9dfd55792e7

目标文件详细内容与结构.jpg
在可执行文件中,标识符存储在了.shstrtab中
.shstrtab: 字符串表。在ELF文件中用到了很多字符串,比如段名,变量名等。当 ELF 文件的其它部分需要引用字符串时,只需提供该字符串在字符串表中的位置索引即可。

这样做的目的就是为了调试程序,因此我们可以在调试器中看到标识符与其值之间的对应关系。

2.标识符是否会被加载到内存中?

答案当然是表示符不会加载到内存中。首先,先看一段代码

int g(int x)
{
    return x + 2017;
}

编译后:

g:
.LFB0:
  .cfi_startproc
  pushl   %ebp
  .cfi_def_cfa_offset 8
  .cfi_offset 5, -8
  movl    %esp, %ebp
  .cfi_def_cfa_register 5
  movl    8(%ebp), %eax
  addl    $2017, %eax
  popl    %ebp
  .cfi_restore 5
  .cfi_def_cfa 4, 4
   ret
  .cfi_endproc
.LFE0:
  .size   g, .-g
  .globl  f
  .type   f, @function

以“.”开头的行代表链接有关的代码,删除后是:

g:
    pushl   %ebp
    movl    %esp, %ebp
    movl    8(%ebp), %eax
    addl    $2017, %eax
    popl    %ebp
    ret

查看这一看:

 movl    8(%ebp), %eax 

这一行就表示将x从栈里取出来放在eax中。X的表示形式为栈址(%ebp)加偏移量。根本没有出现x(g其实也是不存在的,这只是个tag,为了简写汇编程序的。变成机器码后就相当于没有g了)

总结:标识符的根本就是不存在的啊,这些标识符就是栈址 + 偏移的形式。

上一篇 下一篇

猜你喜欢

热点阅读