section和segment
section和segment
最近遇到一个问题,我想构建一个很大的kernelImage.elf文件来进行测试。我在测试代码中加入了全局变量aaa[10000],并且也赋了初值,然而现实却是,elf文件大小并没有增加,该全局变量仍然在.bss段中。则可咋整呢?询问燕姐,得知解决方法是把小节.bss放到大节的.text中去。我想燕姐说的小节即节信息section,大节即段信息segment,尝试后,果然elf变大了十几兆。这也让我产生了思考,节信息section和段信息segment,到底应当如何定义和区分呢?
首先汇编器根据语法规则,会将汇编源码中表示“节”的语法关键字section 或segment 在目标文件中编译成“节”,此“节”便是我们要讨论的section。经过汇编生成目标文件之后,由这些section 或segment 修饰的程序区域便成为了“节” section )。
但操作系统加载程序时并不关心节的数量和大小,操作系统只关心节的属性,因为程序必然是要加载到内存中才能运行的,而内存的访问会涉及到全局描述符表中段描述符的访问权限等属性,保护模式下对任何内存的访问都要经过段描述符才行。比如程序代码所在的段描述符权限属性必须是只读,数据所在的段描述符的权限属性必然是可读写,程序中那些只读的节(比如代码区域)必然不能指向可读写的段描述符,同样,程序中的数据也不能用只读权限的段描述符去访问。
操作系统在加载程序时,不需要对逐个节进行加载,只要给出相同权限的节的集合就行了,例如把所有只读可执行的节(如代码节.text 和初始化代码节.init )归并到一块,所有可读写的节(如数据节.data 和未初始化节.bss )归并到一块,这样操作系统就能为它们分配不同的段选择子,从而指向不同段描述符,实现不同的访问权限了。
为了程序能在操作系统上运行,操作系统和编译器需要相互配合,此时汇编器只生成了目标文件,尚未链接,因此这个将“节”合井的工作是由链接器来完成的,链接器将目标文件中属性相同的节合并成一个大的section 集合,此集合便称为segment,也就是段,此段便是我们平时所说的可执行程序内存空间中的代码段和数据段。
编译器提供的关键字Section 只是为了让程序员在逻辑上将程序划分成几个部分,因为它是伪指令,CPU 都不知道有这个东西,更不知道咱们交给它执行的代码经过了这很多的“风风雨雨”。甚至,我怀疑as 即使提供了这个section ,它也不知道这个section 中的内容是什么,是代码?数据? as不关心,也没必要关心,因为这是它给程序员的福利,程序员自己知道在哪个section 中是什么就行啦。
一般section的应用场所是根据不同的属性人为地将程序划分几部分,如数据放在一个section 中,指令放在另一个section 中,这样程序员便将指令和数据分开了,使代码结构清晰明了,更易于维护。程序如何划分,这个没有规定,完全是看程序员自己的风格喜好,甚至可以利用section 把程序切得零碎不堪,所以你懂了,as 根本没必要知道你的section 中到底是啥。
关键字section 并没有对程序中的地址产生任何影响,即在默认情况下,有没有section 都一个样, section 中数据的地址依然是相对于整个文件的顺延,仅仅是在逻辑上让开发人员梳理程序之用。
自定义的section 名,会在elf 的section header 中显示出来。下面是几个标准的section (节)名,不是segment (段〉名, segment 没有名称。
节名 说明
.data 用于存入数据,可读可写
.text 用于存入代码,只读可执行
.bss 全局未初始化区域
在汇编代码中,若以标准节名定义section,如我们定义的.bss 便是标准节名。编译器会按照以上说明中的要求使用section 内的数据。
不管定义了多少节名,最终要把属性相同的section,或者编译认为可以放到一块的,合并到一个大的segment 中,也就是elf 中说的program header 中的项。
由此可见,某个节( section )属于某个段( segment),段是由节组成的。另外多说一句,最终给加载器用的也是program header 中显示的段,这才是进程的资源。
总结一下:
section 称为节,是指在汇编源码中经由关键字section 或segment 修饰、逻辑划分的指令或数据区域,汇编器会将这两个关键字修饰的区域在目标文件中编译成节,也就是说“节”最初诞生于目标文件中。
segment 称为段,是链接器根据目标文件中属性相同的多个section 合并后的section 集合,这个集合称为segment,也就是段,链接器把目标文件链接成可执行文件,因此段最终诞生于可执行文件中。我们平时所说的可执行程序内存空间中的代码段和数据段就是指的segment 。