3. 类文件结构(JVM)
2017-01-12 本文已影响22人
outSiderYN
标签(空格分隔): JVM
概述
任何一个Class文件都对应着唯一一个类或接口的定义信息,但反过来说,类或接口并不一定都得定义在文件里(譬如类或接口也可以通过类加载器直接生成)
Class文件是一组以8字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑的排列在Class文件之中,中间没有添加任何分隔符,这使得整个Class文件中存储的内容几乎全是程序运行的必要数据,没有空隙存在。当遇到需要占用8字节以上空间的数据项时,则会按照高位在前的方式分割成若干个8位字节进行存储
-
使用类似C语言结构的伪结构来存储数据:
- 无符号数:基本数据类型,以u1 u2 u4 u8来分别代表1个字节、2个字节、4个字节和8个字节的无符号数,无符号数可以用来描述数字、索引引用、数量值或者按照UTF-8编码构成字符串值
- 表:由多个无符号数或者其他表作为数据项构成的复合数据类型,所有表都习惯性的以“_info”结尾。表用于描述有层次关系的符合结构的数据,整个Class文件本质上就是一张表
-
无论是是顺序还是数量,甚至于数据存储的字节序(Byte Ordering,Class文件中字节序为Big-EndIan)这样的细节,都是被严格限定的,哪个字节代表什么含义,长度是多少,先后顺序如何,都不允许改变
模块详解
Class文件结构构成
-
头4个字节称为魔数(Magic Number):唯一作用确定这个文件是否为一个能被虚拟机接受的Class文件,Class文件的魔数(0xCAFEBABE)
-
紧接着魔数的4个字节存储的是Class文件的版本号:56字节是次版本号(Minor Version),78字节是主版本号(Major Version)
-
紧接着主次版本号之后的是常量池入口:Class文件之中的资源仓库
- 存放两大类常量:字面量(Literal)和符号引用(Symbolic Reference)
- 字面量(Literal):文本字符串、声明为final的常亮值等
- 符号引用(Symbolic Reference):
- 类和接口的全限定名(Full Qualified Name)
- 字段的名称和描述符(Descriptor)
- 方法的名称和描述符
-
紧接着的两个字节代表访问标志(access flags):用于识别一些类或接口层次的访问信息
-
紧接着按顺序出现类索引、父类索引、接口索引
- 类索引、父类索引:一个u2类型的数据
- 接口索引:一组u2类型的数据,而且入口第一项为接口计数器,表示索引表的容量
-
紧接着是字段表:用于描述接口或类中声明的变量。字段包括类级变量和实例级变量,但不包括在方法内部声明的局部变量
-
紧接着是方法表集合:如果父类方法在子类中没有被重写,方法表集合中就不会出现来自父类的方法信息
-
紧接着是属性表集合:
- Slot是虚拟机为局部变量分配内存所使用的最小单位,对于基本数据类型不超过32位的数据类型,每个局部变量占用1个Slot,而double和long这两种64位数据类型需要两个Slot存放
- Code属性用于描述代码,所有其他数据项目都用来描述元数据
字节码指令简介
- 各种指令预览
- 加载和存储指令
- 运算指令
- 类型转换指令
- 对象创建和访问指令
- 操作数栈管理指令
- 控制转移指令
- 方法调用和返回指令
- 异常处理指令
- 同步指令