JVM学习三（垃圾回收以及垃圾回收器）

2020-02-16 本文已影响0人 rrrwx

参考：https://www.jianshu.com/p/23f8249886c6

垃圾回收

（一）垃圾判断算法

1、引用计数法

引用计数算法是将垃圾回收分摊到整个应用程序的运行当中了，而不是在进行垃圾收集时，要挂起整个应用的运行，直到对堆中所有对象的处理都结束。因此，采用引用计数的垃圾收集不属于严格意义上的Stop-The-World的垃圾收集机制

2、可达性分析算法

通过GC ROOT的对象作为搜索起始点，通过引用向下搜索，所走过的路径称为引用链。通过对象是否有到达引用链的路径来判断对象是否可被回收（可作为GC ROOT的对象：虚拟机栈中引用的对象，方法区中类静态属性引用的对象，方法区中常量引用的对象，本地方法栈中JNI引用的对象）

（二）垃圾回收算法

1、标记-清除算法

标记-清除算法（Mark-Sweep）是最基础的一种垃圾回收算法，它分为2部分，先把内存区域中的这些对象进行标记，哪些属于可回收标记出来，然后把这些垃圾拎出来清理掉。清理掉的垃圾就变成未使用的内存区域，等待被再次使用。
问题：内存碎片、标记清除效率不高

2、复制算法

复制算法（Copying）是在标记清除算法基础上演化而来，解决标记清除算法的内存碎片问题。它将可用内存按容量划分为大小相等的两块，每次只使用其中的一块。当这一块的内存用完了，就将还存活着的对象复制到另外一块上面，然后再把已使用过的内存空间一次清理掉。保证了内存的连续可用，内存分配时也就不用考虑内存碎片等复杂情况。
问题：每次可用内存缩小一半

3、标记-整理算法

标记-整理算法（Mark-Compact）标记过程仍然与标记-清除算法一样，但后续步骤不是直接对可回收对象进行清理，而是让所有存活的对象都向一端移动，再清理掉端边界以外的内存区域。
问题：对内存变动更频繁，需要整理所有存活对象的引用地址，效率低于复制算法

4、分代收集算法

分代收集算法（Generational Collection）融合了上述3种基础的算法思想，根据对象存活周期的不同将内存划分为几块。
（1）在新生代中，每次垃圾收集时都发现有大批对象死去，只有少量存活，那就选用复制算法，只需要付出少量存活对象的复制成本就可以完成收集。
（2）在老年代中，因为对象存活率高、没有额外空间对它进行分配担保，就必须使用标记-清理算法或者标记-整理算法来进行回收。

（三）垃圾收集器

GCer.jpg

1、Serial收集器

（1）最基本，发展最悠久；
（2）单线程垃圾收集器（“Stop The World”）；
（3）桌面应用场景（因为虚拟机分配到的内存空间不大，用户停顿时间在毫秒级）；

2、ParNew收集器

实际上就是Serial收集器的多线程版本，使用多线程进行垃圾收集（多个垃圾GC线程）；
可与CMS收集器（Concurrent Mark Sweep）配合工作；

这里引入“并行”和“并发”的区别：
“并行”：指多条垃圾收集进程并行工作，但此时用户线程仍处于等待状态；
“并发”：指用户进程和垃圾收集进程同时执行（但不一定是并行的，可能会交替执行），用户程序继续执行，垃圾收集进程运行于另一个CPU上。

3、Paraller Scavenge收集器

（1）复制算法（新生代收集器）
（2）多线程收集器
（3）达到可控制的吞吐量：
-XX:MaxGCPauseMillis垃圾收集器最大停顿时间
-XX:GCTimeRatio吞吐量（倒数）大小：如果值设置为19，那允许的最大GC时间就占总时间的5%---1/(1+19)

吞吐量（Throughput）：CPU用于运行用户代码的时间与CPU总消耗时间的比值，即
吞吐量 = 运行用户代码时间 / （运行用户代码时间 + 垃圾收集时间）。

停顿时间越短就月适合需要与用户交互的程序，良好的相应速度能提升用户体验；另外，GC停顿时间缩短是以牺牲吞吐量和新生代空间来换取的，相应的是垃圾收集频率的提升

高吞吐量则能高效率地利用CPU时间，尽快完成程序运算任务，主要适合在后台运算而不需要太多交互的任务
（4）重要特性：
-XX:+UseAdaptiveSizePolicy(开关参数)，这个参数打开之后，就不需要手工指定一些细节参数，只需设置基本的内存数据设置等以及停顿时间、吞吐量，虚拟机能根据当前系统的运行情况收集性能监控信息，动态调整这些参数以提供最合适的停顿时间或者最大的吞吐量，这叫做GC的自适应调节策略（GC Ergonomics）。
（5）适用于服务器端；
（6）无法与CMS收集器配合工作。

4、CMS收集器（Concurrent Mark Sweep）

CMS收集器以获取最短回收停顿时间为目标
其工作过程分为4个步骤：
（1）初始标记（CMS initial mark）
（2）并发标记（CMS concurrent mark）
（3）重新标记（CMS remark）
（4）并发清除（CMS concurrent sweep）
其中步骤1、3需要“Stop The World”，步骤1、2、4是单线程，步骤3是多线程；另外步骤2、4耗时最长，并能和用户程序并行执行。
优点：低停顿，并发收集
缺点：
1）占用大量CPU资源；
2）无法处理浮动垃圾（Floating Garbage）；

浮动垃圾是指每次并发清除时，用户线程所产生未能标记的新垃圾，待下一次GC时才会被清除。因此CMS会预留一部分空间提供并发收集时的用户程序使用，可以通过-XX:CMSInitiatingOccupancyFration，如果设置的太小会出现“Concurrent Mode Failure”失败，在JDK1.6以后，此时会临时启用Serial Old收集器。

3）空间碎片，给大对象的分配带来很大麻烦。
注意：当出现“Concurrent Mode Failure”失败、或者存在大量空间碎片时，会触发Full GC。

5、G1收集器

G1（Garbage-First）收集器是当前最前沿的垃圾收集器
（面向服务端应用）
（1）步骤：
1）初始标记（Initial Marking）
2）并发标记（Concurrent Marking）：将这个阶段对象变化记录在线程Remembered Set Log中；
3）最终标记（Final Marking）：将前一阶段的记录数据合并到Remember Set中，此时要停顿线程，而且可以并行执行；
4）筛选回收（Live Data Counting and Evacuation）：首先对各个Region的回收价值和成本进行排序，根据用户所期望的GC停顿时间来制定回收计划。
（2）优点：
1）并行与并发：充分利用多CPU、多核环境的硬件优势，缩短Stop-The-World停顿的时间；
2）分代收集：将整个Java堆划分成多个大小相等的独立区域（Region），仍保留新生代、老年代的概念；
3）空间整合：基于“标记-整理”的算法，不会产生空间碎片，有利于程序长时间运行；
4）可预测的停顿（重要优势）：除了降低停顿时间外，还能建立可预测的停顿时间模型，即明确指定M毫秒的时间片段内，消耗在垃圾收集上的时间不超过N毫秒。

G1会跟踪每个Region里面的垃圾堆积的价值大小（回收所获得的空间大小以及回收所需时间的经验值），在后台维护一个优先列表，根据允许的收集时间，优先回收价值最大的Region；

另外有一个重要的问题：怎么解决垃圾回收时两个Regoin之间或者老年代与新生代之间的引用问题？
虚拟机使用Remembered Set来避免全堆扫描。程序在堆Reference类型的数据进行写操作时，会产生一个Write Barrier暂时中断写操作，检查其引用对象是否处于不同区域，如果是，则通过CardTable把相关引用信息记录到被引用对象所属的Region的Remembered Set之中。这样在垃圾回收时，在GC Root的枚举范围中加入Remembered Set即可保证不对全堆扫描也不会有遗漏。

6、Serial Old收集器

Serial收集器的老年代版本，同样是一个单线程收集器，使用“标记-整理”算法；
主要在Client模式下的虚拟机使用；
jdk8已放弃使用

7、Parallel Old收集器

Parallel Scavenge收集器的老年代版本，使用多线程，以及“标记-整理”算法；

在注重吞吐量以及CPU资源敏感的场合，都可以优先考虑Parallel Scavenge / Parallel Old组合