JVM 学习之垃圾回收
什么是“垃圾”?
对我们已经没有使用价值的东西就称为“垃圾”。在 JVM 中无用的对象就称为“垃圾”,因为它占用了我们宝贵的内存资源。
哪里有“垃圾”?
前面我们已经了解过了 JVM 的内存,现在复习一下。我们知道程序计数器、虚拟机栈、本地方法栈都是线程私有的,这几个区域随着线程消亡而消亡,可以达到自动清理的效果。Java 堆、方法区则是共享区域,各种对象的实例保存在 Java 堆中。所以这两个区域会出现“垃圾”
谁是“垃圾”?
怎么确定谁是垃圾,这里提供了两种算法,分别是:引用计数算法、可达性分析算法
引用计数算法
引用计数算法的思路是这样的:
每当有一个地方引用它时,计数器的值就加 1;当引用失效的时候,计数器就减 1。任何时刻计数器为 0 的对象就是不可能被再次使用的。
这种方法效率高,但是会出现无法回收的情况,请看下面的代码:
public class Main {
public static void main(String[] args) {
MyObject object1 = new MyObject();
MyObject object2 = new MyObject();
object1.object = object2;
object2.object = object1;
object1 = null;
object2 = null;
}
}
class MyObject{
public Object object = null;
}
这两个对象已经不可能再被访问了,但是因为他们还互相引用着对方,导致引用计数都不为 0,垃圾回收器无法回收他们。
可达性分析算法
这个算法的基本思路是:通过一系列的称为 “GC Roots” 的对象作为起点,从这些节点开向下搜搜,搜索所走过的路径称为引用链,当一个对象到 GC Roots 没有任何引用链相连的时候就说明对象是不可用的。
垃圾回收算法
标记-清除(Mark-Sweep)算法
这是最基础的垃圾回收算法,思想简单,这个算法分为两个阶段,一个是“标记”,一个是“清除”。
算法大致思路:
标记出所有需要回收的对象,在标记完成之后统一回收所有被标记的对象
缺点:效率低,标记和清除的效率都不高;标记清除之后会产生大量不连续的内存碎片。
复制(Copying)算法
这个算法实现简单、高效、不容易产生碎片,但是将可用内存缩小为原来内存的一半,来看看这个算法是什么思路:
将可用内存按容量分为大小相等的两块,每次使用其中的一块,当这块内存用完了,就将还存活着的对象复制到另外一块内存上面,然后把这块已经使用的内存一次性清理掉。简单粗暴。
标记-整理(Mark-Compact)算法
算法标记阶段和Mark-Sweep一样,但是在完成标记之后,它不是直接清理可回收对象,而是将存活对象都向一端移动,然后清理掉端边界以外的内存
分代收集算法
分代收集算法是目前大部分JVM的垃圾收集器采用的算法。根据对象存活的生命周期将内存划分为若干个不同的区域。一般情况下将堆区划分为老年代(Tenured Generation)和新生代(Young Generation),老年代的特点是每次垃圾收集时只有少量对象需要被回收,而新生代的特点是每次垃圾回收时都有大量的对象需要被回收,那么就可以根据不同代的特点采取最适合的收集算法。
内存分配与回收策略
我们知道,对象的分配就是在 Java 堆上分配,对象主要分配在新生代 Eden 区上,也可能分配在别的区域上(可设置内存相关参数)。
对象优先分配在 Eden
大多数情况下,对象在新生代 Eden 区域中分配。如果 Eden 区域没有足够的空间分配的时候,就会触发 Minor GC
大对象直接进入老年代
什么样的对象称为大对象?所谓的大对象是指需要大量连续内存空间的 Java 对象,典型的大对象就是那种很长的字符串以及数组。
长期存活的对象将进入老年代
虚拟机需要解决哪些对象放在新生代,哪些对象应该放在老年代的问题。为了解决这个问题,虚拟机给对象定义了一个对象年龄的计数器。如果对象在 Eden 出生并且第一次 Minor GC 后仍然存活,并且能被 Survivor 容纳的话,将被移动到 Survivor 空间中,并且将对象的年龄设置为 1。如果这个对象在 Survivor 空间中能够熬过 Minor GC,年龄再增加 1 岁,当年龄增加到一定程度时(默认为 15 岁),就会晋升到老年代。