5.JVM层GC调优
JVM与调优
imooc
JVM
Markdown
JVM的内存结构
运行时数据区
方法区 (共享)
堆 (共享)
虚拟机栈 (私有)
本地方法栈 (私有)
程序计数器(PC) (私有)
程序计数器PC Register
JVM支持多线程同时运行,每个线程有自己的PC Register,线程正在执行的方法叫做当前方法,如果是java代码,PC Register里面存放的就是当前正在执行的指令的地址。如果是C代码,则为空。
虚拟机栈JVM Stacks
Java虚拟机栈(Java Virtual Machine Stacks) 是线程私有的,生命周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧,用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。
堆Heap
Java堆是Java虚拟机所管理的内存中最大的一块。堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象示例,几乎所有的对象实例都在这里分配内存。
Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。
堆的优势是可以在运行时动态地分配内存空间,不必事先告诉编译器。
方法区Method Area
方法区与Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做Non-Heap(非堆),目的是与Java堆区分开来。对应于jdk1.8 的MetaSpace。
tips: 常量池Run-Time Constant Pool
运行时常量池(Runtime Constant Pool)是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Constant Pool Table),用于存放编译器生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。
本地方法栈Native Method Stacks
本地方法栈(Native Method Stack)与虚拟机栈所发挥的作用是非常相似的,它们之间的区别不过是虚拟机栈为虚拟机执行Java方法(也就是字节码)服务,而本地方法栈则为虚拟机使用到的Native方法服务。
非堆区: 是操作系统的本地内存,独立于JVM之外的
Metaspace= Class、Package、Method、Field、字节码、常量池、符号引用等等
CCS: 32位指针的Class
CodeCache: JIT编译后的本地代码、JNI使用的C代码
常用参数
-Xms -Xmx
-XX:NewSize -XX:MaxNewSize (新生代的大小/最大的大小)
-XX:NewRatio(New区和Old区比例) -XX:SurvivorRatio (Eden区和Survivor区比例)
-XX:MetaspaceSize -XX:MaxMetaspaceSize (指定Metaspace大小)
-XX:+UseCompressedClassPointers(是否启用压缩的类指针)
-XX:CompressedClassSpaceSize(设置压缩类指针的内存大小,默认1G)
-XX:InitialCodeCacheSize
-XX:ReservedCodeCacheSize
常用垃圾回收算法
思想:枚举根节点,做可达性分析
根节点:类加载器、Thread、虚拟机栈的本地变量表、static成员、常量引用、本地方法栈的变量等等。
标记清除算法
-
算法思想:
算法分为”标记“和”清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收所有。 -
缺点:
效率不高。标记和清除两个过程效率都不高。容易产生碎片(可能不连续),碎片太多会导致提前GC。
复制
-
算法思想:
它将可用内存按容量划分位大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。(Survivor1 和Survivor2就是采用复制算法) -
优缺点:
实现简单,运行搞笑,但是空间利用率低。
标记整理
-
算法思想:
标记过程仍然与“标记-清除” 算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。 -
优缺点:
没有了内存碎片。但是整理内存比较耗时。
分代垃圾回收
Young区用复制算法
Old区用标记清除或者标记整理
对象分配
对象优先在Eden区分配
大对象直接进入老年代:-XX:PretenureSizeThreshold (通过这个参数),超过这个参数的值,进入老年代
长期存活对象进入老年代:-XX:MaxTenuringThreshold -XX:+PrintTenuringDistribution -XX:TargetSuivivorRatio
垃圾收集器
串行收集器Serial:Serial、Serial Old
并行收集器Parallel:Parallel Scavenge、Parallel Old、(吞吐量优先)
并发收集器Concurrent:CMS、G1、(停顿时间优先)
tips: 并行 vs 并发
并行(Parallel):指多条垃圾收集线程并行工作,但此时用户线程仍然处于等待状态。适合科学计算、后台处理等弱交互场景。
并发(Concurrent):指用户线程与垃圾收集线程同时执行(但不一定是并行的,可能会交替执行),垃圾收集线程在执行的时候不会停顿用户程序的运行。适合对响应时间有要求的场景,比如Web。
tips: 停顿时间 vs 吞吐量
停顿时间:垃圾收集器做垃圾回收中断应用执行的时间。-XX:MaxGCPauseMillis
吞吐量:花在垃圾收集的时间和花在应用时间的占比。-XX:GCTimeRatio=<n>,垃圾收集时间占比:1/1+n。
串行收集器
-XX:+UseSerialGC
-XX:+UseSerialOldGC
并行收集器
吞吐量优先
-XX:+UseParallelGC、-XX:+UseParallelOldGC
Server模式下的默认收集器(总共client、server两种,默认超过2G,会启动Server)
并发收集器
响应时间优先
CMS:-XX:+UseConcMarkSweepGC (old区方式) -XX:+UseParNewGC (young区方式)
G1: -XX:+UseG1GC
垃圾收集器搭配
image.png只有有连线就可以搭配使用,java8推荐使用G1(Young区、Old区都可以使用)
如何选择垃圾收集器
- 优先调整堆的大小让服务器自己来选择
- 如果内存小于100M,使用串行收集器
- 如果是单核,并且没有停顿时间的要求,串行或者JVM自己选
- 如果允许停顿时间超过1秒,选择并行或者JVM自己选
- 如果响应时间最重要,并且不能超过1秒,使用并发收集器
Parallel Collector
-XX:+UseParallelGC 手动开启,Server默认开启
-XX:ParallelGCThreads=<N> 多少个GC线程
CPU > 8 N = 5 / 8
CPU < 8N = CPU
Parallel Collector Ergonomics(自适应)
-XX:MaxGCPauseMillis=<N>
-XX:GCTimeRatio=<N>
-Xmx<N>
Ergonomics 方式需要动态调整每个区的条件,性能不是最好。
动态内存调整
-XX:YoungGenerationSizeIncrement=<Y> 默认20%
-XX:TenuredGenerationSizeIncrement=<T> 默认20%
-XX:AdaptiveSizeDecrementScaleFactor=<D> 默认4%
使用比较少。
CMS Collector
- 并发收集
- 低停顿 低延迟
- 老年代收集器
CMS垃圾收集过程
- CMS initial mark :初始标记Root,STW
- CMS Concurrent mark: 并发标记
- CMS-concurrent-preclean: 并发预清理
- CMS remark: 重新标记,STW
- CMS concurrent-sweep:并发清除
- CMS-concurrent-reset:并发重置
CMS的缺点
CPU敏感(GC与应用一起使用)
浮动垃圾
空间碎片
CMS的相关参数
-XX:ConcGCThreads: 并发的GC线程数
-XX:+UseCMSCompactAtFullCollection: FullGC之后做压缩
-XX:CMSFullGCsBeforeCompaction: 多少次FullGC之后压缩一次
-XX:CMSInitiatingOccupancyFraction: 触发FullGC (默认92%old区垃圾)
-XX:+UseCMSInitiatingOccupancyOnly:是否动态调
-XX:+CMSScavengeBeforeRemark: FullGC之前先做YGC(调优参数,通常会打开)
-XX:+CMSClassUnloadingEnabled: 启用回收Perm区(1.7之前)
iCMS (增量的CMS)
适用于单核或双核(1.8已经废弃)
G1 Collector (1.8主流、1.9默认,并将CMS过时)
The Garbage-First (G1) collector is a server-style garbage collector, targeted for multi-processor machines with large memories. It meets garbage collection (GC) pause time goals with a high probability, while achieving high throughput. The G1 garbage collector is fully supported in Oracle JDK 7 update 4 and later releases. This means heap sizes of around 6GB or larger,and a stable and predictable pause time below 0.5 seconds.
新生代和老生代收集器
G1的几个概念
Region
SATB: Snapshot-At-The-Begining,它是通过Root Tracing得到的,GC开始时候存活对象的快照。
RSet:记录了其他Region中的对象引用本Region中对象的关系,属于points-into结构(谁引用了我的对象)
YoungGC
新对象进入Eden区
存活对象拷贝到Survivor区
存活时间达到年龄阈值时,对象晋升到Old区
以上 阶段和通常的GC收集器一致
MixedGC
不是FullGC,回收所有的Young和部分Old
global concurrent marking
global concurrent marking
- Initial marking phase: 标记GC Root,STW
- Root region scanning phase: 标记存活Region
- Concurrent marking phase: 标记存活的对象
- Remark phase: 重新标记,STW
- Cleanup phase:部分STW
MixedGC时机
-
InitiatingHeapOccupancyPercent:
堆占用率达到这个数值则触发global concurrent marking,默认45% -
G1HeapWastePercent:
在global concurrent marking结束之后,可以知道区有多少空间要被回收,在每次YGC之后和再次发生Mixed GC之前,会检查垃圾占比是否达到此参数,只有达到了,下次才会发生Mixed GC。
MixedGC相关参数
G1MixedGCLiveThresholdPercent:Old区的region被回收时候的存活对象占比
G1MixedGCCountTarget:一次global concurrent marking之后,最多执行Mixed GC的次数。
G1OldCSetRegionThreshodPercent:一次Mixed GC中能被选入CSet的最多old区的region数量
-XX:+UseG1GC: 开启G1
-XX:G1HeapRegionSize=n: region的大小,1-32M,2048个
-XX:MaxGCPauseMillis=200:最大停顿时间
-XX:G1NewSizePervent、-XX:G1MaxNewSizePercent
-XX:G1ReservePercent=10: 保留防止to space溢出
-XX:ParallelGCThreads=n: STW线程数
-XX:ConcGCThreads=n:并发线程数=1/4*并行
G1最佳实践
- 年轻代大小: 避免使用-Xmn、-XX:NewRatio等显式设置Young区大小,会覆盖暂停时间目标。
- 暂停时间目标:暂停时间不要太严苛,其吞吐量目标是90%的应用程序时间和10%的垃圾回收时间,太严苛会直接影响到吞吐量。
-
关于MixedGC调优:
-XX:InitiatingHeapOccupancyPercent
-XX:G1MixedGCLiveThresholdPercent、-XX:G1HeapWastePercent
-XX:G1MixedGCCountTarget
-XX:G1OldCSetRegionThresholdPercent
切换到G1的场景
50%以上的堆被存活对象占用
对象分配和晋升的速度变化非常大
垃圾回收时间特别长,超过了1秒
可视化GC日志工具
- 在线工具:http://gceasy.io/
- GCViewer
打印日志相关参数
-XX:+PrintGCDetails -XX:+PrintGCTimeStamps
-XX:+PrintGCDateStamps
-Xloggc:$CATALINA_HOME/logs/gc.log
-XX:+PrintHeapAtGC
-XX:+PrintTenuringDistribution
ParallelGC调优
初始设置
-XX:+DisableExplicitGC (禁用明确GC)
-XX:+HeapDumpOnOutOfMemoryError
-XX:+HeapDumpPath=CATALINA_HOME/logs/gc.log
Parallel GC调优的指导原则
- 除非确定,否则不要设置最大堆内存
- 优先设置吞吐量目标
- 如果吞吐量目标达不到,调大最大内存,不能让OS使用Swap,如果仍然达不到,降低目标。
- 吞吐量能达到,GC时间太长,设置停顿时间的目标。
ParallelGC调优(参考)
-
设置Metaspace大小
-XX:MetaspaceSize=64M -XX:MaxMetaspaceSize=64M -
添加吞吐量和停顿时间参数
-XX:GCTimeRatio=99 -XX:MaxGCPauseMillis=100 -
修改动态扩容增量
-XX:YoungGenerationSizeIncrement=30
G1 GC调优
G1调优相关参数
-XX:+UseG1GC
-Xms128M
-Xmx128M
-XX:MetaspaceSize=64M
-XX:MaxGCPauseMillis=100
-XX:+UseStringDeduplication
-XX:StringDeduplicationAgeThreshold=3