五、JVM系列(垃圾回收机制)
前言
在Java中,如果一个对象不可能再被引用,那么这个对象就是垃圾,应该被回收,以防占用内存。
如何判断垃圾?
1、引用计数法
我们可以很容易想到,通过引用计数的方法,当一个对象被引用的时候,引用+1,去除引用的时候-1,即引用数量为0的时候该对象就是垃圾,应该被回收。
例如下面的例子:
例子1
String a = new String("你好");
a = null;
我们创建了一个String类型的对象,对象值是“你好“ 由引用a 指向它。此时我们可以理解成该对象被a引用,此时它的引用+1
。接着我们让a = null。即去除该对象的引用。此时引用-1.最后引用数量为0,因此该对象就被视为垃圾,应该被回收。
例子2
public class ReferenceCountingGC {
public Object instance;
public ReferenceCountingGC(String name) {
}
public static void testGC(){
ReferenceCountingGC a = new ReferenceCountingGC("objA");
ReferenceCountingGC b = new ReferenceCountingGC("objB");
a.instance = b;
b.instance = a;
a = null;
b = null;
}
}
例子2中,我们分别创建了两个ReferenceCountingGC 对象,由a和b 指向,并且两个对象中有一个成员变量instance。
接着我们让 a.instance = b;即对象a中的instance变量指向了b指向的引用, b.instance = a;对象b中的instance 指向了a指向的引用。然后分别a=null,b=null。我们看下图:
虽然原先a和b对象 没有被a,b引用了。但是a和b对象中的instance相互引用了对方。即a对象中的instance指向了b对象。b对象中的instance指向了a对象。即a和b对象都被引用着,即使我们设置了a = null,b=null。他们的引用数量也不为0。所以通过引用计数法就没法判断他们是否是垃圾,从而没法进行回收,浪费内存。
2、GC Root Tracing算法(可达性分析算法)。
GC Root Tracing算法大概的过程是:
从GC Root Tracing出发,所有可达的对象都是存活的对象,不可达的对象视为垃圾。而什么是GC Root Tracing呢?
GC Root Tracing就是一组活跃的引用集合,大概包括:
- 所有当前被加载的类
- Java类中的引用类型静态变量
- Java类的运行时常量池里的引用类型常量
- VM的一些静态数据结构指向GC堆里的对象引用
- 等
大概流程可以看如下图:
如何进行垃圾回收?
当JVM识别出了垃圾之后,如何进行回收呢?垃圾回收简单的说有三种算法:标记清除算法、复制算法、标记压缩算法
- 标记清除算法
分为标记和清除阶段,在标记阶段,标记所有从GC Root出发可达的对象,此时不可达的对象就是垃圾对象。之后在清除阶段将没有标记的对象清除。缺点就是:导致会产生很多内存碎片,即内存不连续。虽然对象可以分配在不连续的内存空间中,但是这样效率要低于连续的内存空间。 - 复制算法
将原有的内存分为两块,每次只使用一块。在垃圾回收的时候,通过 GC Root Tracing算法,将正在使用的内存中活跃的对象复制到未使用的内存块中。之后清除正在使用的内存块中的对象。然后交换两个内存块的角色,完成垃圾回收。该算法的的缺点就是要将内存折半,大大浪费内存 - 标记压缩算法
该算法是标记清除算法的优化版本,分别经历了标记、压缩阶段。标记阶段我们都知道了,而在压缩阶段中,则将所有存活的对象压缩在内存的一边,之后将外界的对象回收。 - 小结
标记清除算法,虽然会产生很多的内存碎片,但是不需要移动太多对象,比较适合对象存活多的时候。
复制算法,虽然会将内存折半,但是可以使得内存连续,适合对象少的情况。
标记压缩算法则是标记清除算法的优化版本,也要经过标记,但是只是压缩到另一边。使得保持内存连续。
分代思想
以上我们介绍了三种垃圾回收算法,但是在JVM实际进行垃圾回收的时候则不是单独的只用某一种算法。而是根据实际情况,采用不同的算法。
所谓分代算法:就是根据JVM不同的内存区域,采用不同的垃圾回收算法。例如对于存活对象少的新生代区域,采用复制算法,因为对象比较少,可以将需要回收和不需要回收的对象移动到未使用区域和使用区域。对于存活对象比较多的老年代区域,则可以采用标记清除或者标记压缩算法,因为这样一来就不用移动太多对象。
分区思想
以上分代思想是根据对象的数量多少来划分,新生代和老年代。分区思想则是根据对象的生命周期长短来划分老年代和新生代。然后根据不同代采用不同的垃圾回收算法。但在JVM中其实还有一个分区思想,就是将整个堆空间划分成连续的不同小区域,每个期间都独立使用。独立回收。以下图我们来小结以上分析的JVM垃圾回收机制
image.png