30-类的加载过程(类的生命周期)
2022-04-29 本文已影响0人
紫荆秋雪_文
一、概述
Java中数据类型分为“基本数据类型”和“引用数据类型”。
- 基本数据类型:由虚拟机预先定义
- 引用数据类型:需要进行类的加载 image.png
- 从程序中类的使用过程看 image.png
二、过程一:加载(Loading)阶段
1、加载完成的操作
1.1、加载的理解
- 所谓加载就是将Java类的字节码文件加载到机器内存中,并在内存中构建出Java类的原型——类模板对象
- 类模板对象,其实就是Java类在JVM内存中的一个快照,JVM将从字节码文件中解析出的常量池、类字段、类方法等信息存储到类模板中,这样JVM在运行期便能通过类模板而获取Java类中的任意信息,能够对Java类的成员变量进行遍历,也能进行Java方法调用
- 反射的机制即基于这一基础,如果JVM没有将Java类的声明信息存储起来,则JVM在运行期也无法反射
1.2、加载完成的操作
- 加载阶段,简言之,查找并加载类的二进制数据,生成Class的实例
- 在加载类时,Java虚拟机必须完成以下3件事情:
- 通过类的全名,获取类的二进制数据流
- 解析类的二进制数据流为方法区的数据结构(Java类模型)
- 创建java.long.Class类的实例,表示该类型。作为方法区这个类的各种数据的访问入口
2、二进制流的获取方式
对于类的二进制数据流,虚拟机可以通过多种途径产生或获得。只要所读取的字节码符合JVM规范即可
-
虚拟机可以通过文件系统读入一个class后缀的文件(最常见的字节码文件)
-
读入jar、zip等归档数据包,提取类文件
-
事先存放在数据库中的类的二进制数据
-
使用类似于HTTP之类的协议通过网络进行加载
-
在运行时生成一段Class的二进制信息等
-
在获取到类的二进制信息后,Java虚拟机就会处理这些数据,并最终转为一个java.lang.Class的实例
-
如果输入数据不是ClassFile的结构,则会抛出ClassFormatError
3、类模型与Class实例的位置
3.1、类模型的位置
- 加载的类在JVM中创建相应的类结构,类结构会存储在方法区(JDK8之前:永久代,之后:元空间)
3.2、Class实例的位置
- 类将.class文件加载至元空间后,会在堆中创建一个java.lang.Class对象,用来封装类位于方法区内的数据结构,该Class对象是在加载类的过程中创建的,每个类都对应有一个Class类型的对象 image.png
- 外部可以通过访问代表Order类的Class对象来获取Order的类数据结构
3.3、注意
- Class类的构造方法是私有的,只有JVM能够创建
- java.lang.Class实例是访问类型元数据的接口,也是实现反射的关键数据、入口。通过Class类提供的接口,可以获得目标类所关联的.class文件中具体的数据结构:方法、字段等信息
- 通过反射加载Class类信息
public void classMethod() {
try {
Class clazz = Class.forName("java.lang.String");
// 获取当前运行时类声明的所有方法
Method[] methods = clazz.getDeclaredMethods();
for (Method m : methods) {
// 获取方法的修饰符
String mod = Modifier.toString(m.getModifiers());
System.out.println(mod + " ");
//获取方法的返回值类型
String simpleName = m.getReturnType().getSimpleName();
System.out.println(simpleName + " ");
//获取方法名
System.out.println(m.getName() + "(");
Class<?>[] ps = m.getParameterTypes();
if (0 == ps.length) {
System.out.println(")");
}
for (int i = 0; i < ps.length; i++) {
char end = (i == (ps.length - 1)) ? ')' : ',';
System.out.println(ps[i].getSimpleName() + end);
}
}
} catch (ClassNotFoundException e) {
e.printStackTrace();
}
}
4、数组类的加载
- 创建数组类的情况稍微有些特殊,因为数据类本身不是由类加载器负责创建,而是由JVM在运行时根据需要而直接创建的,但数组的元素类型仍然需要依靠类加载器去创建。
- 如果数组的元素类型是引用类型,那么就遵守定义的加载过程递归加载和创建数组的元素类型
- JVM使用指定的元素类型和数组纬度来创建新的数组类
- 如果数组的元素类型是引用类型,数组类的可访问性就由元素类型的可访问性决定。否则数组类的可访问性将被缺省定义为public
三、过程二:链接(Linking)阶段
1、链接(Linking)阶段之验证阶段(Verification)
- 当类加载到系统后,就开始链接操作,验证是链接操作的第一步
- 验证的主要目的就是保证加载的字节码是合法、合理并符合规范的 image.png
- 说明:验证的内容则涵盖了类数据信息格式验证、语义检查、字节码验证,以及符号引用验证等
- “格式验证”和加载阶段一起执行。验证通过之后,类加载器才会成功将类的二进制数据信息加载到方法区中
- 格式验证之外的验证操作将会在方法区中进行
- 链接阶段的验证虽然拖慢了加载的速度,但是它避免了在字节码运行时还需要进行各种检查。正所谓“磨刀不误砍柴工”
1.1、格式验证
- 是否以魔数 0xCAFEBABE开头,主版本和副版本号是否在当前Java虚拟机的支持范围内,数据中每一个项是否都拥有正确的长度等
1.2、字节码的语义检查,但凡在语义上不符合规范的,虚拟机也不会给予验证通过
- 是否所有的类都有父类的存在,在Java里,除了Object外,其他类都应该有父类
- 是否一些被定义为 final 的方法或者类被重写或继承了
- 非抽象类是否实现了所有抽象方法或者接口方法
- 是否存在不兼容的方法(如:方法的签名除了返回值不同,其他都一样,这种方法会让虚拟机无从下手调度;abstract情况下的方法,就不能是final的了)
1.3、字节码验证,字节码验证也是“验证过程中最为复杂的一个过程”。它试图通过对字节码流的分析,判断字节码是否可以被正确的执行
- 在字节码的执行过程中,是否会跳转到一条不存在的指令
- 函数的调用是否传递了正确类型的参数
- 变量的赋值是不是给了正确的数据类型
- 栈映射帧(StackMapTable)就是在这个阶段,用于检测在特定的字节码处,其局部变量表和操作数栈是否有着正确的数据类型。但遗憾的是,100%准确地判断一段字节码是否可以被安全执行是无法实现的,因此,该过程只是尽可能地检查出可以预知的明显的问题。如果在这个阶段无法通过检查,虚拟机也不会正确装载这个类。但是,如果通过了这个阶段的检查,也不能说这个类是完全没有问题的
1.4、符号引用的校验
- Class文件在其常量池会通过字符串记录自己将要使用的其他类或者方法。因此,在验证阶段,“虚拟机就会检查这些类或者方法确实是存在的”,并且当前类有权限访问这些数据,如果一个需要实用类无法再系统中找到,则会抛出NoClassDefFoundError,如果一个方法无法被找到,则会抛出NoSuchMethodError
2、准备
主要是为累的静态变量分配内存,并将其初始化为默认值
当一个类通过验证后,虚拟机就会进入准备阶段。在这个阶段,虚拟机就会为这个类分配相应的内存空间,并设置默认初始值。
- Java虚拟机为各类型变量默认的初始值 image.png
2.1、注意
- Java并不支持boolean类型,对于boolean类型,内部实现是int,由于int的默认值是0,故对应的boolean的默认值就是false
- 这里不包含基本数据类型的字段用static final修饰的情况,因为final在编译的时候就会分配了,准备阶段会显示赋值
- 注意这里不会为实例变量分配初始化,类变量会分配在方法区中,而实例变量是会随着对象一起分配到Java堆中
- 在这个阶段并不会像初始化阶段中那样会有初始化或者代码被执行
2.2、实例
- 基本数据类型,非final修饰的变量,在准备环节进行默认初始化赋值
public class LinkingTest {
private static long id;
}
image.png
- 基本数据类型,final修饰的变量,在准备环节直接进行显示赋值
public class LinkingTest {
private static final int num = 1;
private static final String constStr = "CONST";
}
image.png
3、解析
将类、接口、字段和方法的符号引用转为直接引用
3.1、作用
- 符号引用就是一些字面量的引用,和虚拟机的内部数据结构和内存布局无关。比较容易理解的就是在Class类文件中,通过常量池进行了大量的符号引用。但是在程序实际运行时,只有符号引用是不够的,比如当println()方法被调用时,系统需要明确知道该方法的位置
- 以方法为例,Java虚拟机为每个类都准备了一张方法表,将其所有的方法都列在表中,当需要调用一个类的方法的时候,只要知道这个方法在方法表中的偏移量就可以直接调用该方法。通过解析操作,符号引用就可以转变为目标方法在类中方法表的位置,从而使得方法被成功调用
3.2、小结
- 所谓解析就是将符号引用转为直接引用,也就是得到类、字段、方法在内存中的指针或者偏移量。因此,可以说,如果直接引用存在,那么可以肯定系统中存在该类、方法或者字段。但只存在符号引用,不能确定系统中一定存在该结构
- Java虚拟机规范并没有明确要求解析阶段一定要按照顺序执行。在HotSpotVM中,加载、验证、准备和初始化会按照顺序有条不紊地执行,但链接阶段中的解析操作往往会伴随着JVM在执行完初始化之后在执行
3.3、字符串
- 由于字符串在程序开发中有着重要的作用,因此有必要了解一下String在Java虚拟机中的处理。当在Java代码中直接使用字符串常量时,就会在类中出现CONSTANT_String,它表示字符串常量,并且会引用一个CONSTANT_UTF8的常量项。在Java虚拟机内部运行中的常量池中,会维护一张字符串拘留表(intern),它会保存所有出现过的字符串常量,并且没有重复项。只要以CONSTANT_String形式出现的字符串也都会在这张表中。使用String.intern()方法可以得到一个字符串在拘留表中的引用,因为该表中没有重复项,所以任何字面相同的字符串的String.intern()方法返回总是相同的
四、过程三:初始化(Initialization)阶段
为类的静态变量赋予正确的初始值
描述
-
类的初始化是类装载的最后一个阶段。如果前面的步骤都没有问题,那么表示类可以顺利装载到系统中。此时,类才会开始执行Java字节码。(即:到了初始化阶段,才真正开始执行类中定义的 Java 程序代码)
-
初始化阶段的重要工作时执行类的初始化方法:<clinit>()方法
- 该方法仅能有Java编译器生成并由JVM调用
- 它是由类静态成员的赋值语句以及static语句块合并产生的
-
加载一个类之前,虚拟机总是会试图加载该类的父类,因此父类的<clinit>总是在子类<clinit>之前被调用。也就是说,父类的static块优先级高于子类
Java编译器并不会为所有的类产生<clinit>()初始化方法。哪些类在编译Wie字节码后,字节码文件中将不会包含<clinit>()方法?
一个类中并没有声明任何的“类变量”,也没有静态代码块时
- code
public class InitializationTest {
public int id;
public void add() {
}
}
image.png
- 定义类变量
public class InitializationTest {
// 字段
public int id;
// 定义类变量
public static int id1 = 1;
public void add() {
}
}
image.png
- 静态代码块
public class InitializationTest {
// 字段
public int id;
// 定义类变量
public static int id1 = 1;
public static int number;
static {
number = 2;
System.out.println(number);
}
public void add() {
}
}
image.png
- 小结:类变量和static代码块都是在<clinit>()方法中初始化的
一个类中声明类变量,但是没有明确使用类变量的初始化语句以及静态代码块来执行初始化操作时
- code
public class InitializationTest {
// 字段
public int id;
// 定义类变量
public static int id1;
}
image.png
- 类变量显示赋值会生成<clinit>方法
public class InitializationTest {
// 字段
public int id;
// 定义类变量
public static int id1;
// 定义类变量,并显示赋值
public static int id2 = 5;
}
image.png
一个类中包含static final修饰的基本数据类型的字段,这些类字段初始化语句采用编译时常量表达式
- code
public class InitializationTest {
// 字段
public int id;
// 定义类变量
public static int id1;
// 定义类常量
public static final int id2 = 5;
}
image.png
1、static与final的搭配修饰的字段的显示赋值的操作,到底是在哪个阶段进行赋值
1.1、在链接阶段的准备环节赋值
- code
public class InitializationTest {
// 定义类常量
public static final int id2 = 5;
public static final String str = "CONST";
}
image.png
1.2、在初始化阶段<clinit>()中赋值
- 赋值是需要类型转换
public class InitializationTest {
// 定义类常量
public static final int id2 = 5;
public static final Integer id7 = 7;
public static final String str = "CONST";
}
image.png
- code
public class InitializationTest {
// 定义类常量
public static final int id2 = 5;
public static final int id7 = new Random().nextInt(10);
public static final String str = "CONST";
}
image.png
- 赋值是使用new
public class InitializationTest {
// 定义类常量
public static final int id2 = 5;
public static final String str = "CONST";
public static final String str2 = new String("CONST");
}
image.png
总结
在链接阶段的准备环节赋值的情况
- 对于基本类型的字段来说,如果使用 static final 修饰,则显示赋值(直接赋值常量,而非调用方法)通常是在链接阶段的“准备环节”进行
- 对于String来说,如果使用字面量的方式赋值,使用static final修饰的话,则显示赋值通常是在链接阶段的准备环节进行
在链接阶段的初始化阶段<clinit>()中赋值的情况
- 排除上面的情况
2、<clinit>()的线程安全性
- 对于<clinit>()方法的调用,也就是类的初始化,虚拟机会在内部确保其多线程环境中的安全性
- 虚拟机会保证一个类的<clinit>()方法在多线程环境中被正确地加锁、同步,如果多个线程同时去初始化一个类,那么只会有一个线程去执行这个类的<clinit>()方法,其他线程需要阻塞等待,知道活动线程执行<clinit>()方法完毕
- 正是因为函数<clinit>()带锁线程安全的,因此,如果在一个类的<clinit>()方法中有耗时很长的操作,就可能造成多个线程阻塞,引发死锁。并且这种死锁是很难发现的,因此看起来它们并没有可用的锁信息
3、类的初始化情况:主动使用 vs 被动使用
3.1、主动使用
- Class只有在必须要首次使用的时候才会被装载,Java虚拟机不会无条件地装载Class类型。Java虚拟机规定,一个类或者接口在初次使用前,必须要进行初始化。这里指的“使用”是指主动使用,主动使用只有下列几种情况
3.1.1、当创建一个类的实例时,比如使用new关键字,或者通过反射、克隆、反序列化
3.1.2、当调用类的静态方法时,即当使用了字节码 invokestatic指令
3.1.3、当使用类、接口的静态字段时,比如,使用getstatic或putstatic。(对应访问变量、赋值变量操作)
3.1.4、当使用java.lang.reflect包中的方法反射类的方法是。比如Class.forName("com.lkty.loadandstore.InitializationTest")
3.1.5、当初始化子类时,如果发现其父类还没有进行过初始化,则需要先触发器父类的初始化。并不要求该类实现的接口也要先初始化
3.1.6、如果一个接口定义了default方法,那么直接实现或者间接实现该接口的类的初始化,该接口哟啊在其之前被初始化
3.1.7、当虚拟机启动时,用户需要指定一个要执行的主类(包含main方法的那个类),虚拟机会先初始化这个主类。JVM启动的时候通过移到类加载器加载一个初始类。这个类在调用public static void main(String[] arg)方法之前被链接和初始化。这个方法的执行将以此导致所需的类的加载、链接和初始化
3.1.8、当初次调用 MethodHandle 实例时,初始化该 MethodHandle 指向的方法所在的类。(涉及解析REF_getStatic、REF_putStatic、REF_invokeStatic方法句柄对应的类)
3.2、被动使用
- 除了以上的情况属于主动使用,其他的情况均属于被动使用。被动使用不会引起类的初始化。也就是说,并不是在代码中出现的类,就一定会被加载或者初始化。如果不符合主动使用的条件,类就不会初始化