G1详情解读
G1(Garbage First)
1. G1的由来
Garbage First 简称G1,是Java提出的最新垃圾回收算法,它摒弃了之前CMS等垃圾回收算法将JVM内存物理划分为年轻代、老年代和永久代的做法,转而采用了离散内存的思想,将JVM内存划分为若干个region,每个region分配固定大小的内存空间,作为内存回收的基本单位,年轻代老年代以及永久代各由若干的region组成,并且各年代可以离散的分布在JVM内存空间,不必像之前的内存回收算法为每个分代分配一片连续的内存空间;使用G1后可以不需要配置年轻代中Survival区与Eden区的大小比例,以及老年代和年轻代的比例,只需要配置期望的StopWorld的GC时间,G1会根据配置的时间来进行收集,尽量使停顿的时间不超过配置的期望值,正因为要达到这个目的,所以要有选择性的收集垃圾,优先回收全部或者大部分是垃圾的Region,因此才叫做Garbage First,这便是G1的由来;
1.1 JVM内存划分
jvm的内存空间分为本地栈,虚拟机栈,堆,程序计数器以及方法区,其中堆和方法区是线程共享的,其他的都是线程隔离的,垃圾回收主要关注的地方在于堆空间,堆空间可以划分为年轻代,老年代和永久代,在G1中新增了新的分区Homogeneous区,用来存放大对象;
虽然G1也使用了分区的思想,但是并不想以前的回收算法年轻代和老年代都是连续的地址空间,在G1中,整个堆空间划分为了若干个Region,每个Region的大小是2的整数幂,大小在1M-32M之间,默认将堆划分为2048个region,年轻代老年代离散的分布在堆空间中,如下图:
imageHumongous区是JDK8新增的一个针对于大对象的特殊区域,其隶属于老年代,当分配的对象大小大于Region大小的50%时,这个对象会被认为是大对象,将会分配到Humongous区,对于一个Humongous区也无法容纳的对象,G1会寻找一个连续的HRegion来存放该对象,如果找不到会启动fullgc回收来达到目的,并且因为Humongous区是属于老年代的,大对象过多会大大增加fullgc的频率,因此在程序中一定要避免出现大对象;
对象的分配策略:JVM会为每个工作线程在Eden区分配一块线程独占的内存区域,叫做TLAB(Thread Local Allocation Buffer),线程创建对象是首先在自己的TLAB中创建,当TLAB内存空间不够用时,才会去Eden区创建对象,如果是大对象,则直接在Humongous区分配;
1.2 G1的垃圾回收策略及类型
1.2.1 标记回收对象
G1中使用RSet来记录对象之间的引用关系,采用的是Point-in的标记策略,与CMS垃圾回收算法相比,CMS采用的是Point-out的标记策略,记录的是老年代中所有对象指向新生代对象的引用关系,而G1则相反,记录的是当前对象被其他分区对象引用的情况,采用这种策略的原因是G1中的Region太多,不可能对每个Region都建立一个Point-out的Rset,对于每个新生代Region,只需要记录老年代到新生代的引用关系,不需要记录新生代之间的引用,这是因为每次回收时都会对新生代进行全扫描;
如果每个Rset记录的引用关系粒度是对象级别会造成记录过多而影响内存使用率,因此G1中的Rset将每个Region分成了若干个等大的小分区,叫做Card,大小在128Byte到512Byte之间,Rset记录的是当前Card中的对象被其他Region中的Card的引用关系,从而降低了Rset的大小;
Rset实际的数据结构是一个HashTable,key是引用当前地址的其他Region的Card起始地址,用来标记不同的card,Value是个字节标志位,0代表没有被引用,1代表被引用;
1.2.2 YoungGC
触发时机:当Eden区的空间不足以创建新对象时,会触发G1 的YoungGC;
YoungGC的所有阶段:
-
阶段1:根扫描
扫描静态和本地对象
-
阶段2:更新RS
处理dirty card队列更新RS
-
阶段3:处理RS
检测从年轻代指向年老代的对象
-
阶段4:对象拷贝
拷贝存活的对象到survivor/old区域
-
阶段5:处理引用队列
软引用,弱引用,虚引用处理
1.2.3 G1 MixGC
触发时机:当老年代的占用整个堆空间的比例大于参数设置的阀值时触发,XX:InitiatingHeapOccupancyPercent(默认45%);
-
初始标记(initial mark,STW)
在此阶段,G1 GC 对根进行标记。该阶段与常规的 (STW) 年轻代垃圾回收密切相关,一般是在 YoungGC Stop The world 回收内存时进行;
-
根区域扫描(root region scan)
G1 GC 在初始标记的存活区扫描对老年代的引用,并标记被引用的对象。该阶段与应用程序(非 STW)同时运行,并且只有完成该阶段后,才能开始下一次 STW 年轻代垃圾回收。
-
并发标记(Concurrent Marking)
G1 GC 在整个堆中查找可访问的(存活的)对象。该阶段与应用程序同时运行,可以被 STW 年轻代垃圾回收中断
-
最终标记(Remark,STW)
该阶段是 STW 回收,帮助完成标记周期。G1 GC 清空 SATB 缓冲区,跟踪未被访问的存活对象,并执行引用处理。
-
清除垃圾(Cleanup,STW)
在这个最后阶段,G1 GC 执行统计和 RSet 净化的 STW 操作。在统计期间,G1 GC 会识别完全空闲的区域和可供进行混合垃圾回收的区域。清理阶段在将空白区域重置并返回到空闲列表时为部分并发。