技术转载——JVM里面Java类的生命周期,一篇搞定
写在前面:2020年面试必备的Java后端进阶面试题总结了一份复习指南在Github上,内容详细,图文并茂,有需要学习的朋友可以Star一下!
GitHub地址:https://github.com/abel-max/Java-Study-Note/tree/master
如果说核心类库的 API 比做数学公式的话,那么 Java 虚拟机的知识就好比公式的推导过程
类生命周期
- 加载(Loading)四种类加载器:JAVA_HOME 目录里面的内容双亲委任
- 连接(Linking)验证阶段准备阶段解析阶段
- 初始化类初始化的七种触发情况:
- 卸载
JVM
每本Java入门书籍在介绍Java这门语言的时候都会提到Java跨平台,“一次解释,到处运行的特点“,功臣就是jvm(Java Virtual Machine,Java虚拟机)。
但是,如果将jvm只与Java语言绑定在一起,那么理解就过于狭隘了,Java虚拟机发展到现在已经脱离了Java语言,形成了一套相对独立,高性能的执行方案。
技术转载——JVM里面Java类的生命周期,一篇搞定除了以上提到的几种语言之外,scala,热门的kotlin都可以运行在jvm上面。
技术转载——JVM里面Java类的生命周期,一篇搞定jvm内存结构规范
先简单看一下 JVM 内存结构,之后会详细讲解这一块的具体存储。
类生命周期
类从被加载到虚拟内存中开始,到卸载内存为止,它的整个生命周期包括:
技术转载——JVM里面Java类的生命周期,一篇搞定类从加载到卸载整个生命周期
小提示:
- 加载阶段和连接阶段有时候是交叉进行的,不需要等到完全加载结束。
- 解析阶段有时候可以在初始化之后再做。Jvm仅仅规定了:如果某些字节码使用了符号引用,那么在执行这些字节码之前,需要完成对这些符号引用的解析。
- 但是这些过程中的开始时间和完成时间都是上图固定顺序。
- 这里的“加载阶段”和我们常说的“类加载”是两回事,“类加载”指的是虚线框中三部分加起来。
加载(Loading)
加载,是指查找字节流,并且据此创建类的过程。是 类加载 过程的一个阶段。 虚拟机需要在这个过程完成三件事情:
- 通过一个类的全限定名来获取此类的二进制字节流;
- 将这个字节流所代表的静态存储结构转化为方法去的运行时数据结构;
- 在内存中生成一个代表这个类的java.lang.Class对象,作为这个方法区这个类的各种数据的访问入口。
类加载
从虚拟机的角度来说,只存在两种不同的类加载器:一种是启动类加载器(Bootstrap ClassLoader),该类加载器使用C++语言实现,属于虚拟机自身的一部分。另外一种就是所有其它的类加载器,这些类加载器是由Java语言实现,独立于JVM外部,并且全部继承自抽象类java.lang.ClassLoader。
四种类加载器:
- 启动(Bootstrap)类加载器
启动类加载器负责加载最为基础、最为重要的类。负责将 JAVA_HOME/lib 下面的类库加载到内存中(比如rt.jar)。由于引导类加载器涉及到虚拟机本地实现细节,开发者无法直接获取到启动类加载器的引用,所以不允许直接通过引用进行操作。
注:启动类加载器是由 C++ 实现的,没有对应的 Java 对象,因此在 Java 中只能用 null 来指代。除了启动类加载器之外,其他的类加载器都是 java.lang.ClassLoader 的子类,因此有对应的 Java 对象。这些类加载器需要先由另一个类加载器,比如说启动类加载器,加载至 Java 虚拟机中,方能执行类加载。
- 标准扩展(Extension)类加载器
它负责加载相对次要、但又通用的类,负责将 JAVA_HOME/jre/lib/ext 或者由系统变量 java.ext.dirs指定位置中的类库加载到内存中。
- 应用程序(Application)类加载器
它负责将系统类路径(CLASSPATH) 中指定的类库加载到内存中。由于这个类加载器是ClassLoader中的 getSystemClassLoader()方法的返回值,因此一般称为系统(System)加载器
- 自定义类加载器
除了由 Java 核心类库提供的类加载器外,我们还可以加入自定义的类加载器,来实现特殊的加载方式。举例来说,我们可以对 class 文件进行加密,加载时再利用自定义的类加载器对其解密。
JAVA_HOME 目录里面的内容
之所以写这个是因为平时开发中很少有人翻开这个文件夹来看,上面讲到这个目录顺便带着大家来看看。
技术转载——JVM里面Java类的生命周期,一篇搞定JAVA_HOME/bin目录放的很多命令
技术转载——JVM里面Java类的生命周期,一篇搞定JAVA_HOME/lib目录
技术转载——JVM里面Java类的生命周期,一篇搞定JAVA_HOME/jre/lib目录
技术转载——JVM里面Java类的生命周期,一篇搞定JAVA_HOME/jre/lib/ext目录
双亲委任
双亲委任工作流程
双亲委派机制的工作流程:
- 当前ClassLoader首先从自己已经加载的类中查询是否此类已经加载,如果已经加载则直接返回原来已经加载的类。
每个类加载器都有自己的加载缓存,当一个类被加载了以后就会放入缓存,等下次加载的时候就可以直接返回了。
- 当前classLoader的缓存中没有找到被加载的类的时候,委托父类加载器去加载,父类加载器采用同样的策略,首先查看自己的缓存,然后委托父类的父类去加载,一直到bootstrp ClassLoader.
- 当所有的父类加载器都没有加载的时候,再由当前的类加载器加载,并将其放入它自己的缓存中,以便下次有加载请求的时候直接返回。
为什么需要双亲委任安全机制?
- 直观理解
试想一下黑客自定义一个 java.lang.String 类,该 String 类具有系统的 String 类一样的功能,只是在某个函数稍作修改。 这个函数经常使用,假如在这这个函数中植入一些“病毒化 码”。并且通过自定义类加载器加入到 JVM 中。完了,程序凉凉,这是比较直观的理解。
- 真实原因
要完全理解这个问题还需要引入一个概念,类的 命名空间 。
类需要类的全限定名(类的全路径)以及加载此类的ClassLoader来共同确定。也就是说即使两个类的全限定名是相同的,但是因为不同的ClassLoader加载了此类,那么在JVM中它是不同的类。
比如上面说的,我们 JDK 本身提供的类库,比如 string,hashmap,linkedlist 等等,这些类由bootstrp 类加载器加载了以后,无论你程序中有多少个类加载器,那么这些类其实都是可以共享的,这样就避免了不同的类加载器加载了同样名字的不同类以后造成混乱。
概括:
- 检查顺序:自底向上
- 加载顺序:自顶向下
连接(Linking)
验证阶段
当一个类被加载之后,必须要验证一下这个类是否合法,比如这个类是不是符合字节码的格式、变量与方法是不是有重复、数据类型是不是有效、继承与实现是否合乎标准等等。
我们平常写代码很多时候第一步都是写校验,jvm也是这个思路,Java 编译器生成的类文件必然满足 Java 虚拟机的约束条件,但是为了防止“解字节码注入”。
验证阶段大致会完成下面四个阶段的检验动作:
- 文件格式验证 (主要验证是否符合Class文件格式规范,并且能被当前版本的虚拟机处理。)
基于二进制字节流进行验证,只有通过了这个阶段的验证后,字节流才会进入内存的方法区中进行存储,所以后面的验证阶段全是基于方法区的存储结构进行的,不会再直接操作字节流。
- 元数据验证(对字节码描述的信息进行语义分析,以保证其描述的信息符合Java语言规范的要求)
如验证这个类是否有父类(除了java.lang.Object是所有类的父类),如果这个类不是抽象类是否实现了父类或者接口中要求实现的所有方法等。
- 字节码验证
- 符号引用验证(发生在虚拟机将符号引用转化为直接引用的时候,这个转化动作将在连接的第三阶段解析阶段中发生)
如验证符号引用中通过字符串描述的全限定名是否能找到对应的类。
准备阶段
就是为类的静态变量分配内存并设为 jvm 默认的初值,而不是我们设置的 ,我们设置的会在后面一个阶段“初始化”期间来做,对于非静态的变量,则不会为它们分配内存。
jvm默认的初值是这样的:
基本类型 (int、long、short、char、byte、boolean、float、double)的默认值为0。其中boolean只有true,false两种类型,对应到jvm值分别是数据1,0。
引用类型 (对象,数组)的默认值为null。
构造其他跟类层次相关的数据结构,比如说用来实现虚方法的动态绑定的方法表。
在 class 文件被加载至 Java虚拟机之前,这个类无法知道其他类及其方法、字段所对应的具体地址,甚至不知道自己方法、字段的地址。因此,每当需要引用这些成员时,Java 编译器会生成一个符号引用。在运行阶段,这个符号引用一般都能够无歧义地定位到具体目标上(因为验证阶段进行符号引用验证了)。
例外:public static final int value=123,常量直接赋值为设置的123.
解析阶段
上面说到的“在运行阶段,这个符号引用一般都能够无歧义地定位到具体目标上”,就是在解析阶段进行的符号解析。
这个阶段目的正是将常量池中的符号引用转换解析成为实际引用。在解析阶段,jvm会将所有的类或接口名、字段名、方法名转换为具体的内存地址,从而让用到了别的类或者接口的类能找到和加载其他的类/接口。
如果符号引用指向一个未被加载的类,或者未被加载类的字段或方法,那么解析将触发这个类的加载(但未必触发这个类的链接以及初始化)
初始化
在 Java 代码中,如果要初始化一个静态字段,我们可以在声明时直接赋值,也可以在静态代码块中对其赋值。除了 final static 修饰的常量,直接赋值操作以及所有静态代码块中的代码,则会被 Java 编译器置于同一方法中,并把它命名为 < clinit > 。
类加载的最后一步是初始化,目的便是为标记为常量值的字段赋值,以及执行< clinit > 方法的过程。Java 虚拟机会通过加锁来确保类的 < clinit > 方法仅被执行一次。
类初始化的七种触发情况:
- 当虚拟机启动时,初始化用户指定的主类(main函数);
- 当遇到用于新建目标类实例的 new 指令时,初始化 new 指令的目标类;
- 当遇到调用静态方法的指令时,初始化该静态方法所在的类;
- 人类的初始化会触发父类的初始化;
- 如果一个接口定义了 default 方法,那么直接实现或者间接实现该接口的类的初始化,会触发该接口的初始化;
- 使用反射 API 对某个类进行反射调用时,初始化这个类;
- 当初次调用 MethodHandle 实例时,初始化该 MethodHandle 指向的方法所在的类。
设计模式中单例延迟加载,便是充分利用了这个特点。
卸载
那么多的类,什么 时候 卸载 谁 呢?关于卸载谁,满足如下条件:
- 该类所有的实例都已经被回收,也就是java堆中不存在该类的任何实例;
- 加载该类的ClassLoader已经被回收;
- 该类对应的java.lang.Class对象没有任何地方被引用,无法在任何地方通过反射访问该类的方法。
关于什么时候卸载,当以上条件都满足了,垃圾回收时候会在方法区清空类信息进行卸载,英雄迟暮,这个类的一生也就走到了尽头了。