类文件结构
-
Java虚拟机不和Java等任何语言绑定,只和存储字节码的Class文件这种特定的二进制文件格式关联,且并不关心Class的来源是何种语言,也体现了Java虚拟机的语言无关性。
-
Java语言中的各种变量,关键字和运算符号的语义最终都由多条字节码命令组合而成的,因此字节码命令的语义描述能力比Java本身要强
1. 魔数与Class文件的版本
每个Class文件的头4个字节称为魔数,它的唯一作用是用于确定这个文件是否是一个能被虚拟机接受的Class文件
- 使用魔数而不是扩展名来进行识别是基于安全的考虑,因为扩展名容易被更改
- Class文件的魔数是
"CAFEBABE"
- 第5和第6个字节是次版本号
- 第7和8个字节是主版本号
2. 常量池
常量池常量池是Class文件结构中与其他项目关联最多的数据类型,也是占用Class文件空间最大的数据项目之一,同时它还是在Class文件中第一个出现的数据项目
常量池中入口有一个u2类型的数据,代表常量池容量计数值,这个容量计数由1开始,例如16,代表10进制22,表示常量池中有21项常量,索引值为1-21
常量池中主要存放两大类常量:字面量和符号引用。
- 字面量比较接近Java语言层面的常量概念,如文本字符串、被声明为final的常量值等。
- 符号引用属于编译原理方面的概念,包括
1)类和接口的全限定名
2)字段的名称和描述符
3)方法的名称和描述符
常量池中的每一项都是一个表,共有14种结构各不相同的表结构数据
- 这14种表(或者常量项结构)的共同点是:表开始的第一位是一个u1类型的标志位(tag),代表当前这个常量项使用的是哪种表结构,即哪种常量类型。
- Java语言中方法和字段的最大长度就是
CONSTANT_Utf8_info
的length
的最大长度,即65535
3. 访问标志
访问标志常量池结束后,紧接着的2个字节代表访问标志(access_flags),这个标志用于识别一些类或接口层次的访问信息,包括:这个
Class
是类还是接口;是否定义为public
类型;是否定义为abstract
类型;如果是类的话,是否被声明为final
- access_flags需要做或运算
4. 类索引、父类索引与接口索引集合
类索引(this_class)和父类索引(super_class)都是一个u2类型的数据、接口索引集合(interfaces)是一组u2类型的数据的集合
- 类索引用于确定这个类的全限定名
- 父类索引用于确定父类的全限定名
- 接口索引确定这个类实现接口的全限定名
类索引和父类索引用u2类型的索引值表示,它们各自指向一个类型为CONSTANT_Class_info
的类描述常量,通过里面的索引值在CONSTANT_Utf8_info
中获得常量
接口索引,第一项为接口计数器,表示索引表的容量。如果该类没有任何接口,则为0
5. 字段表集合
字段表(field_info)用于描述接口或者类中声明的变量。字段包括了类级变量或实例级变量,但不包括在方法内部声明的变量
-
access_flags
和前面一样 -
name_index
表示字段的简单名称 -
descriptor_index
表示字段和方法的描述符
简单名称:没有类型和参数修饰的方法或字段名称,如inc()
方法的简单名称是inc
描述符:作用是描述字段的数据类型、方法的参数列表(数量、类型以及顺序)和返回值
- 字段表不会列出超类和父类的字段,但可能会列出原本代码中不存在的字段,例如内部类为了保持对外部类的访问性,会自动添加指向外部类实例的字段
6. 方法表集合
方法表(methods_info):用于描述接口或者类中声明的方法,和描述字段的方式非常类似,仅在访问标志和属性表集合的可选项中有所区别