《深入理解java虚拟机》笔记(二)----垃圾回收机制
1.内存回收
java的运行时数据区分为方法区、堆、虚拟机栈、本地方法栈和程序计数器,内存回收关注的区域是java堆和方法区,回收的对象是已经"死去"的对象。
2.判断对象的死亡
引用计数法
给对象添加一个引用计数器,有地方引用他,计数器加一,引用失效,计数器减一。计数器为0的对象判断为死亡的对象。但是java中没有采用引用计数法管理内存,理由是它很难解决对象循环引用的问题
可达性分析算法
java、C#等语言采用可达性分析算法来判断对象是否存活。具体做法是,通过一系列称为"GC Roots"对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链,当一个对象到"GC Roots"没有引用链相连,就证明这个对象是不可达的。
java 引用
java希望描述这样一类对象:当内存空间还足够的时候,能保留在内存中;如果内存空间在进行垃圾回收后还是非常紧张,则可以抛弃这些对象。(例如WeakHashMap中的entry)
JDK1.2后对引用进行了扩充,分为
- 强引用
类似Object obj = new Object
,只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象。 - 软引用
软引用关联着的对象,在系统即将抛出内存溢出异常之前,会将这些对象进行第二次回收,如果这次回收后还没有足够的内存才会抛出内存溢出异常。(SoftReference类) - 弱引用
强度比软引用更弱,被弱引用关联的对象,只能生存到下一次垃圾收集发生之前。当垃圾收集器工作的时候,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。(WeakReference类) - 虚引用
最弱的引用关系,无法通过虚引用来取得一个对象实例。虚引用的唯一目的就是在这个对象被收集器回收的时候收到一个系统通知。
对象的finalize()方法
使用可达性分析算法中的不可达对象不会立刻被回收,分两步:
- 若对象分析不可达,则对他进行第一次标记并进行筛选,筛选的根据对象是否需要执行finalize()方法。finalize()方法只会被执行一次(如果能重复执行那么这个对象可能永远无法回收)。如果没有必要执行finalize方法,会直接回收。
- 如果需要执行finalize方法,那么会对这些对象进行第二次标记,如果在finalize()方法中建立有效引用完成自救,那么会对他进行第二次标记并将它移出即将回收的集合。
方法区的回收
方法区垃圾收集的效率远低于堆,主要回收两部分内容:
- 废弃常量
和java堆中对象回收类似,主要包括常量池中的类(接口)、方法、字段的符号引用。 - 无用的类
判断类是无用的类条件比较苛刻,需要满足下面三个条件:
a. 该类所有实例被回收
b.加载该类的ClassLoader已经被回收
c.该类对应的java.lang.Class没有在任何地方引用
3.垃圾收集算法
标记-清除算法
标记出需要回收的对象,标记完成后统一回收所有被标记的对象。CMS垃圾收集器就是采用这种算法。
优势:
最基础算法。
劣势:
标记、清除两个过程效率都不高;会产生空间碎片。
复制算法
解决了标记-清除算法中的空间碎片问题。因为新生代中对象存活对象一般很少,可将内存分为一份较大的Eden区域,两份较小的Survivor区域,每次使用一个Eden和survivor区域,进行垃圾回收的时候将这两个区域的存活对象复制到另一个未使用的survivor区域上。如果survivor区域空间不够,就会使用老年代进行分配担保。
优势:
适合对象存活率低的新生代,没有空间碎片。
劣势:
如果对象存活率高,那么复制操作的开销会很大;会造成部分内存空间浪费。
标记-整理算法
适用于老年代的算法,就是在标记-清除算法的基础上进行了空间整理,解决了空间碎片问题。
优势:
解决了空间碎片问题
劣势:
移动对象也需要开销
分代收集算法
当前商用虚拟机都采用分代收集算法,将内存分为两个年代:
- 新生代
对象存活率较低的区域,适合复制算法 - 老年代
是新生代的分配担保,对象存活率较高的区域,适合标记-整理、标记-清除算法。
4.Stop The world 问题
问题描述
在进行可达性分析的过程中,可能会出现引用关系不断变化的情况,为了避免这个情况,需要停顿所有的进程再进行GC。
HotSpot算法实现
在GC Roots枚举的时候,使用OopMap数据结构来得知哪些地方存在引用,用来快速准确地完成根节点枚举。
为了避免OopMap空间开销过大,设立安全点,只有线程运行到安全点才会发生GC。
安全点又带来了新的问题,如果线程停止就无法运行到安全点。设立安全区域,线程在安全区域的时候,GC可以不用管这个线程。线程在出安全区域的时候,要等这次GC完成。
垃圾收集器
主要的新生代和老年代收集器如图
CMS收集器
特点是并发收集,低停顿,是非常优秀的老年代收集器,使用标记-清除算法。由于停顿时间短,常用于互联网服务器上。收集过程如下:
image.png
总结
为什么要进行内存回收?回收发生在哪里?回收哪些对象?回收算法?实际应用?