JVM垃圾收集器

2017-09-09  本文已影响0人  wangdy12

Garbage Collector(GC)自动管理应用程序的动态内存分配请求

垃圾收集器通过以下操作执行自动动态内存管理:

Java HotSpot垃圾收集器采用各种技术来改进这些操作的效率:

虚拟机内程序计数器、虚拟机栈、本地方法栈3个运行时数据区是线程私有的内存区域,内存分配回收都比较确定,随着方法和线程的结束,回收内存,而堆和方法区是线程共享的存储区域,内存的分配和回收是动态的,是GC处理的核心

Java 11 GC Tuning Guide 文档:
Java Platform, Standard Edition HotSpot Virtual Machine Garbage Collection Tuning Guide, Release 11

Java 9 和11中GC,堆大小,及时编译的默认设置:

基于行为的调优

在行为上,GC主要有两个不同的目标,一个是控制GC的最长停顿时间,使得响应更加及时,另一个方面是控制吞吐量,使得GC时间占比较小,Java HotSpot VM GC 可以配置为优先满足这两个目标之一,如果满足首选目标,GC会尝试最大化另一个目标,因为堆内存大小的限制,以及其他的配置的影响,也存在GC不能满足目标的可能

最大暂停时间 Maximum Pause-Time

暂停时间是垃圾收集器停止应用并回收不再使用的内存空间的持续时间,-XX:MaxGCPauseMillis=<n>用来限制暂停的最长时间,不同GC的默认值不同,调整得过小可能导致垃圾收集更频繁地发生,从而降低应用程序的整体吞吐量

GC会记录平均停顿时间和相对平均值的偏差,如果平均值加上暂停时间的偏差大于目标值,则目标停顿时间未满足

吞吐量 Throughput

吞吐量是根据GC所花费和在垃圾收集之外花费的时间application time来衡量的,由-XX:GCTimeRatio=nnn指定。垃圾收集时间与应用时间的比率为1/ (1+nnn),例如,-XX:GCTimeRatio=19设置垃圾收集为总时间的1/20或5%。

垃圾收集所花费的时间是所有垃圾收集引起的暂停的总时间。如果未满足吞吐量目标,则GC可能会增加堆的大小,以便在两次GC停顿时间之间在应用时间更长

内存占用

如果已满足吞吐量和最大暂停时间的设定,则垃圾收集器会减小堆大小,直到无法满足其中的吞吐量目标。可以使用-Xms=<nnn>-Xmx=<mmm>分别设置GC可以使用的最小和最大堆大小

优化策略


判断对象是否存活

GC回收堆内存空间之前首先要判断对象是否存活

GC Roots对象的种类


引用

java.lang.ref package

一个对象的引用,根据引用强度的强弱,分为四种,GC时根据不同的情况,决定是否回收对应类型对象的内存空间

SoftReference<User>softReference=new SoftReference<User>(new User());
WeakReference<User> weakBuilder = new WeakReference<User>(new User());
package jdk.internal.ref;
public class Cleaner
    extends PhantomReference<Object>

引用对象的状态由两个属性表征:

最开始处于Active状态,当Reference对应的对象可以被垃圾收集器回收时,GC会将该Reference的状态转换为Pending,经过ReferenceHandler处理后转变为Inactive

                         clear/enqueue/GC 
 [active/unregistered]   ------
        |                      |
        | GC                   |
        |                      |--> [inactive/unregistered]
        v                      |
 [pending/unregistered]  ------
                         ReferenceHandler

如果Reference对象创建时指定了ReferenceQueue则对应状态为Registered,GC将其加入到PendingList,ReferenceHandler将其读取出来,加入引用队列后状态转变为Enqueued,用户线程调用ReferenceQueue.remove()函数阻塞式获取队列中的对象,来获知某个引用要被回收,这相当于一种通知机制,从队列中取出后状态转变为Dequeued

内部具体实现上,当加入ReferenceQueue之后,引用对象中的队列信息ReferenceQueue<? super T> queue会被自动覆盖为NULL,下次GC需要回收时就无法再次加入引用队列,内存空间会被直接回收

                           clear
  [active/registered]     ------->   [inactive/registered]
         |                                 |
         |                                 | enqueue [2]
         | GC              enqueue [2]     |
         |                -----------------|
         |                                 |
         v                                 |
  [pending/registered]    ---              v
         |                   | ReferenceHandler
         | enqueue [2]       |--->   [inactive/enqueued]
         v                   |             |
  [pending/enqueued]      ---              |
         |                                 | poll/remove
         | poll/remove                     |
         |                                 |
         v            ReferenceHandler     v
  [pending/dequeued]      ------>    [inactive/dequeued]

Reference时创建时,附加一个引用队列参数

Reference(T referent, ReferenceQueue<? super T> queue)

方法区的回收

Permanent generation(方法区)存储描述类和方法的元数据,需要回收两个部分的内存:废弃常量和无用的类

其中无用的类需要同时满足以下三个条件:


垃圾收集算法基础

性能考虑

GC主要关注两点,吞吐量和延迟

标记 - 清除 Mark-Sweep

首先对所有需要回收的对象进行标记,后来统一回收
这是最基础的收集算法,后续的收集算法都是基于这种思路,并对其不足进行改进而得到的

不足:

  1. 效率不高
  2. 空间问题,产生大量不连续的碎片

标记 - 整理 Mark-Compact

让所有存活对象向一端移动,然后直接清理掉端边界以外的内存

分代收集 Generational Collection

理论上,最直接的垃圾收集算法每次运行时遍历每个可到达的对象,任何剩余的对象都被认为是垃圾。这种方法所花费的时间与活动对象的数量成正比,这对于维护大量实时数据的大型应用程序来说是不可行的

Java HotSpot VM包含许多不同的垃圾收集算法,这些算法都使用称为分代收集 generational collection 的技术。分代收集利用几条对大多数应用程序的经验观测属性来最小化回收未使用(垃圾)对象所需的工作。其中最重要属性是是弱分代假说 weak generational hypothesis,它表明大多数对象都只能存活很短的时间

对象寿命的典型分布

堆区根据对象存活周期的不同将内存分为几块,例如新生代和老年代,区域填满时采用不同的收集算法

最开始,JVM会保留整个Java堆的地址空间,但是只有在需要的时候才分配物理内存

Young Generation 对象填满时,触发 minor collection 回收该区域,时间复杂度与活动对象的数量成比例,通常每次会有部分幸存对象移动到Old Generation,当它填满时触发 major collection 进行回收,清理整个堆区域,通常所需的时间更长,因为涉及更多的对象

复制算法 Copying

新生代代由Eden和两个Survivor空间组成,大多数对象最初都是在Eden中分配的,在任何时候必然由一个Survivor空间是空的,在GC期间充当Eden和另一个Survivor空间中存活对象的目的地;GC之后,Eden和源Survivor空间都是空的。在下一次GC中,两个Survivor空间的用途互换了。最近被填充的一个作为源Survivor,将其中的存活对象复制到另一个Survivor空间。 对象以这种方式在两个Survivor之间复制,直到它们被复制了一定次数或者没有足够的空间,此时这些对象将被复制到老年代中(这个过程叫做aging)

新生代和老年代的晋升

每个对象在新生代有个年龄值,如果经历一次minor gc,对应的年龄就会增加,达到阈值(-XX:MaxTenuringThreshold=n设定,n的最大值为15,parallel collector 默认15,CMS 默认为6),即可晋升,移动到老年代

如果Survivor空间中相同年龄所有对象大小之和大于Survivor空间的一半,年龄大于或者等于该年龄的对象可以直接进入年老代,无需达到阈值的要求

术语:
full GC:清理整个Java 堆区
Stop the World Event : JVM上所有的应用都停止,直到gc操作完成,无论哪种gc算法,无论是新生代还是老年代都会产生STW

影响垃圾收集性能的因素

两个最重要的因素是总可用内存新生代在堆中的比例

堆空间总量 Total Heap

这是影响垃圾收集性能的最重要因素,因为GC在对应分代的内存填满时发生


在初始化虚拟机时,保留堆的整个空间,-Xmx选项指定保留空间的大小,如果-Xms参数的值小于-Xmx参数的值,则不会将所有保留的空间立即交给虚拟机,未提交的空间在图中标记为virtual,随后堆的不同分区,可以根据需要向虚拟空间增长

新生代比例

新生代越大,发生的minor collection就越少,但是,堆大小本身是有限的,新生代比例较大意味着老年代比例较小,这将增加major collection的频率,最佳比例取决于程序内对象的生命周期分布,设定-XX:NewSize=size-XX:MaxNewSize=size-XX:NewRatio=ratio

其中如果survivor空间太小,那么复制收集算法会将数据溢出到老年代,如果太大,浪费空间,设定-XX:SurvivorRatio=ratio


垃圾收集器

JDK 9 到 目前(JDK 11),Java HotSpot VM包括三种不同类型的收集器,每种收集器具有不同的性能特征

Serial Collector (-XX:+UseSerialGC)

串行收集器使用单个线程来执行所有垃圾收集工作,这使得它相对有效,因为线程之间没有通信开销,它最适合单处理器机器,因为它无法利用多处理器硬件,也适用于多处理器上的小型应用程序(内存大小为100MB左右)

使用选项-XX:+UseSerialGC显式启用串行收集器,使用分代收集的原理,新生代使用复制算法,老年代使用标记整理算法

Parallel Collector (-XX:+UseParallelGC)

并行收集器也称为吞吐量收集器throughput collector,它是类似于串行收集器的分代收集器。串行和并行收集器之间的主要区别在于并行收集器具有多个线程,用于加速垃圾收集。

并行收集器适用于运行再在多处理器或多线程硬件上的具有中到大型数据集的应用程序,使用-XX:+UseParallelGC选项启用,新生代使用parallel scavenge garbage collector,老年代parallel garbage collector,如果启动-XX:+UseParallelGC选项,会默认启动-XX:+UseParallelOldGC设定,反之亦然

可以使用-XX:ParallelGCThreads=<N>来控制垃圾收集器线程的数量。因为多个垃圾收集器线程参与minor collection,由于在收集期间从新生代晋升promotion到老年代,可能产生一些碎片。minor collection中的每个垃圾收集线程都会保留老年代的一部分用于晋升,所以将可用空间划分为“晋升缓冲区”会导致碎片效应,减少垃圾收集器线程的数量并增加老年代的大小可以减少这种碎片效应

并行收集器的代分布

并行收集器目标的优先级:当同时设定由最大暂停时间目标,吞吐量目标和最小内存目标时,首先满足最大暂停时间目标,之才是吞吐量目标,最后是内存目标

如果超过98%的总时间花在垃圾收集上并且不到2%的堆空间被回收,则抛出OutOfMemoryError,防止应用程序长时间运行,但由于堆太小进度很慢。也可以通过-XX:-UseGCOverheadLimit来禁用此功能

ParNew (-XX:+UseParNewGC)/ CMS (-XX:+UseConcMarkSweepGC)

ParNew GC在新生代中使用多线程进行垃圾收集,与用于清理老年代的CMS算法配合使用
当设定-XX:+UseConcMarkSweepGC时自动使用,在JDK 8中-XX:+UseParNewGC必须和-XX:+UseConcMarkSweepGC配合使用,选项组合-XX:+UseConcMarkSweepGC -XX:-UseParNewGC已经弃用,从JDK 9开始,弃用-XX:+UseParNewGC选项

Concurrent Collectors

Concurrent Mark Sweep (CMS)和 Garbage-First (G1) 垃圾收集器是两个主要的并发收集器,并发收集器在执行一些昂贵的工作时与应用程序并发运行

并发收集器交换处理器资源(否则可供应用程序使用)以缩短主要收集暂停时间。

最明显的开销是在GC的并发部分会使用一个或多个处理器,在N处理器系统上,并发部分使用可用处理器的 K/N,其中1 <= K <= ceiling{N/4}。除了在并发阶段使用处理器之外,还会产生额外的开销以实现并发。因此,虽然并发收集器的垃圾收集暂停通常要短得多,但应用程序吞吐量也往往略低于其他收集器

在多核的计算机上,应用程序线程在并发部分期间依然可以获得处理器,因此并发垃圾收集器线程不会暂停应用程序,使得暂停时间缩短,但应用程序可用的处理器资源也会减少,并且应该会有一些减速,特别是如果应用程序最大限度地使用所有核。随着N的增加,由于并发垃圾收集导致的处理器资源的减少变得更小,并发收集的益处也会增加

Z Garbage Collector

Z垃圾收集器 (ZGC) 是一个可扩展的低延迟垃圾收集器。 ZGC并发式的执行所有昂贵的工作,不需要停止执行应用线程

ZGC适用于需要低延迟(小于10毫秒暂停)和/或使用非常大的堆(TB量级)的应用,使用-XX:+UseZGC启用,从JDK 11开始,ZGC作为实验性功能提供


选择合适的GC

如有必要,先调整堆大小来提高性能。如果性能仍不符合要求

  1. 如果应用程序具有较小的数据集(最大约100 MB)或者在单个处理器上运行且没有暂停时间要求,则选择串行收集器-XX:+UseSerialGC
  2. 如果应用程序的极限性能是第一优先级考虑并且没有暂停时间要求,或者可以接收一秒或更长的暂停时间,那么可以让VM选择收集器或选择并行收集器-XX:+UseParallelGC
  3. 如果响应时间比总吞吐量更重要,并且垃圾收集暂停必须保证短于一秒左右,那么选择并发收集器-XX:+UseG1GC-XX:+UseConcMarkSweepGC.
  4. 如果响应时间是高优先级,和/或使用的是非常大的堆内存,选择完全并发的收集器-XX:+UseZGC

此外性能还取决于堆的大小,应用程序内的实时数据量以及处理器的数量和速度,如果推荐的收集器未达到所需性能,则首先尝试调整堆和分代的大小。如果性能仍然不足,那么尝试使用不同的收集器:使用并发收集器来减少暂停时间,使用并行收集器来提高多核处理器的总吞吐量


参数配置

选项

-X:非标准选项(不保证所有的 JVM 实现都支持)
-XX:不稳定、不建议随便使用

查询某个参数的默认值,例如MaxHeapSize的值

> java -XX:+PrintFlagsFinal  -version | grep MaxHeapSize
    uintx MaxHeapSize                              := 4173332480                          {product}
java version "1.8.0_181"
Java(TM) SE Runtime Environment (build 1.8.0_181-b13)
Java HotSpot(TM) 64-Bit Server VM (build 25.181-b13, mixed mode)

选项 描述
堆栈空间相关
-Xms -Xmx 堆的最小值和最大值,对于服务器的部署,通常设定为相同的值,避免堆大小调整产生的暂停
-Xss 设定线程调用栈的大小,默认是1M,默认操作系统ulimit -s限定最大为8192KB
-Xmn 新生代的大小,直接设定为固定值,可以通过-XX:NewSize-XX:MaxNewSize分别设定初始大小和最大值
-XX:MaxHeapFreeRatio GC后堆空间的最大空闲比例(默认70%,达到会进行收缩),调小会减小内存占用
-XX:MinHeapFreeRatio GC后堆空间的最小空闲比(默认40%,不足堆空间会进行扩张),调小会减少内存占用
-XX:-ShrinkHeapInSteps 默认情况下开启,逐步减小堆空间到最大空闲比,关闭会立即减小,可能导致性能下降
GC类型
-XX:+UseG1GC 使用G1收集器
-XX:+UseSerialGC 使用Serial GC
-XX:+UseParallelGC 使用 Parallel Scavenge GC
-XX:+UseParallelOldGC 使用 Parallel Old GC
-XX:+UseParNewGC deprecated,JDK 9
-XX:+UseConcMarkSweepGC deprecated,JDK 9
GC性能设定
-XX:MaxGCPauseMillis=n 设定最长停顿时间,毫秒
-XX:GCTimeRatio=n 吞吐量设定,1 / (1 + n),G1默认为12,GC时间占比8%
-XX:ParallelGCThreads=n 设置STW工作线程的值,逻辑处理器的数量不超过8时,n的默认值与逻辑处理器的数量相同,如果有超过8个逻辑处理器,n默认值为逻辑处理器数量的5/8
新生代相关
-XX:NewRatio=n young : old = 1 : n ,默认n为2
-XX:NewSize 新生代的初始大小,推荐为堆大小的25%到50%
-XX:MaxNewSize 新生代的最大值
-XX:SurvivorRatio=n eden/survivor区域的比例,默认为8,即每个survivor占新生代的1/10,默认-XX:+UseAdaptiveSizePolicy是开启的,JVM会动态调整survivor的大小比例,最小为3
-XX:MaxTenuringThreshold=n 对象晋升老年代的年龄阈值,parallel gc默认15,CMS默认为6
G1相关设置
-XX:G1HeapRegionSize 堆区域的大小,默认基于初始和最大堆大小得到,在1到32 MB之间变化,并且必须是2的幂,堆包含大约2048个堆区域
-XX:InitialHeapOccupancyPercent 默认整个堆占比45%时触发并发标记
-XX:ConcGCThreads 并发标记的线程数目,ParallelGCThreads的 1/4
-XX:+G1UseAdaptiveIHOP -XX:InitiatingHeapOccupancyPercent=45 用于自适应控制启动并发标记的堆占用百分比,对于前几个收集周期G1将使用老年代的45%的占用率作为默认阈值
-XX:G1NewSizePercent=5 -XX:G1MaxNewSizePercent=60 新生代的大小,在这两个值之间变化,百分比表示占当前使用的Java堆的比例
-XX:G1HeapWastePercent=5 区域集合中允许未回收空间百分比,如果收集集合候选中的可回收空间低于该阈值,则G1将停止空间回收阶段
-XX:G1MixedGCCountTarget=8 空间回收阶段的进行收集的次数
-XX:G1MixedGCLiveThresholdPercent=85 老年代区域的存活对象大于该比例,不会在空间回收阶段进行垃圾收集
CMS设置
-XX:CMSInitiatingOccupancyFraction 设置启动CMS的老年代占用率,默认值为-1,使用-XX:CMSTriggerRatio的值
-XX:CMSTriggerRatio=percent 内存占用达到-XX:MinHeapFreeRatio的percent%时启动CMS,默认值是80%
其他
-XX:MetaspaceSize 设置触发gc的元数据空间的大小
-Xlog:gc* 发生垃圾收集时,打印日志,等同于PrintGCDetails
-Xlog:gc 使用的是JVM Unified Logging Framework输出log信息,等同于PrintGC, -Xlog 使用样式:-Xlog:tag1[+tag2...][*][=level][:[output][:[decorators][:output-options [,...]]]]
上一篇 下一篇

猜你喜欢

热点阅读