3. 类文件结构(JVM)

2017-01-12  本文已影响22人  outSiderYN

标签(空格分隔): JVM


概述

任何一个Class文件都对应着唯一一个类或接口的定义信息,但反过来说,类或接口并不一定都得定义在文件里(譬如类或接口也可以通过类加载器直接生成)

Class文件是一组以8字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑的排列在Class文件之中,中间没有添加任何分隔符,这使得整个Class文件中存储的内容几乎全是程序运行的必要数据,没有空隙存在。当遇到需要占用8字节以上空间的数据项时,则会按照高位在前的方式分割成若干个8位字节进行存储

  1. 使用类似C语言结构的伪结构来存储数据:

    • 无符号数:基本数据类型,以u1 u2 u4 u8来分别代表1个字节、2个字节、4个字节和8个字节的无符号数,无符号数可以用来描述数字、索引引用、数量值或者按照UTF-8编码构成字符串值
    • 表:由多个无符号数或者其他表作为数据项构成的复合数据类型,所有表都习惯性的以“_info”结尾。表用于描述有层次关系的符合结构的数据,整个Class文件本质上就是一张表
  2. 无论是是顺序还是数量,甚至于数据存储的字节序(Byte Ordering,Class文件中字节序为Big-EndIan)这样的细节,都是被严格限定的,哪个字节代表什么含义,长度是多少,先后顺序如何,都不允许改变

模块详解

Class文件结构构成

  1. 头4个字节称为魔数(Magic Number):唯一作用确定这个文件是否为一个能被虚拟机接受的Class文件,Class文件的魔数(0xCAFEBABE)

  2. 紧接着魔数的4个字节存储的是Class文件的版本号:56字节是次版本号(Minor Version),78字节是主版本号(Major Version)

  3. 紧接着主次版本号之后的是常量池入口:Class文件之中的资源仓库

    • 存放两大类常量:字面量(Literal)和符号引用(Symbolic Reference)
    • 字面量(Literal):文本字符串、声明为final的常亮值等
    • 符号引用(Symbolic Reference):
      • 类和接口的全限定名(Full Qualified Name)
      • 字段的名称和描述符(Descriptor)
      • 方法的名称和描述符
  4. 紧接着的两个字节代表访问标志(access flags):用于识别一些类或接口层次的访问信息

  5. 紧接着按顺序出现类索引、父类索引、接口索引

    • 类索引、父类索引:一个u2类型的数据
    • 接口索引:一组u2类型的数据,而且入口第一项为接口计数器,表示索引表的容量
  6. 紧接着是字段表:用于描述接口或类中声明的变量。字段包括类级变量和实例级变量,但不包括在方法内部声明的局部变量

  7. 紧接着是方法表集合:如果父类方法在子类中没有被重写,方法表集合中就不会出现来自父类的方法信息

  8. 紧接着是属性表集合:

    • Slot是虚拟机为局部变量分配内存所使用的最小单位,对于基本数据类型不超过32位的数据类型,每个局部变量占用1个Slot,而double和long这两种64位数据类型需要两个Slot存放
    • Code属性用于描述代码,所有其他数据项目都用来描述元数据

字节码指令简介

  1. 各种指令预览
    • 加载和存储指令
    • 运算指令
    • 类型转换指令
    • 对象创建和访问指令
    • 操作数栈管理指令
    • 控制转移指令
    • 方法调用和返回指令
    • 异常处理指令
    • 同步指令
上一篇下一篇

猜你喜欢

热点阅读