JVM那些事儿(三)-----常见垃圾回收算法
一,如何判断对象是可回收的对象?
通过可达性分析(Reachability Analysis)来判定对象是否存活的.
这个算法的基本思路是通过一些列的称为"GC Roots"的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Roots没有任何引用链相连接时,则证明此对象是不可用的.
Java语言中,可作为GC Roots的对象主要包括下面几种:
- 虚拟机栈(栈帧中的本地变量表)中引用的对象
- 方法区中类静态属性引用的对象
- 方法区中常量引用的对象
- 本地方法栈中JNI(即一般说的Native方法)引用的对象.
二,如何判断对象是死亡的?
即使在可达性分析算法中不可达的对象,也并非是“非死不可”的,这时候它们暂时处于“缓刑”阶段,要真正宣告一个对象死亡,至少要经历两次标记过程:如果对象在进行可达性分析后发现没有与GC Roots相连接的引用链,那它将会被第一次标记并且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为“没有必要执行”。
如果这个对象被判定为有必要执行finalize()方法,那么这个对象将会放置在一个叫做F-Queue的队列之中,并在稍后由一个由虚拟机自动建立的、低优先级的Finalizer线程去执行它。这里所谓的“执行”是指虚拟机会触发这个方法,但并不承诺会等待它运行结束,这样做的原因是,如果一个对象在finalize()方法中执行缓慢,或者发生了死循环(更极端的情况),将很可能会导致F-Queue队列中其他对象永久处于等待,甚至导致整个内存回收系统崩溃。finalize()方法是对象逃脱死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模的标记,如果对象要在finalize()中成功拯救自己——只要重新与引用链上的任何一个对象建立关联即可,譬如把自己(this关键字)赋值给某个类变量或者对象的成员变量,那在第二次标记时它将被移除出“即将回收”的集合;如果对象这时候还没有逃脱,那基本上它就真的被回收了。
示例代码如下:
public class FinalizeEscapeGc{
public static FinalizeEscapeGc SAVE_HOOK = null;
public void isAlive(){
System.out.println("yes, i am still alive:");
}
protected void finalize() throws Throwable{
super.finalize();
System.out.println("finalize method executed!");
FinalizeEscapeGc.SAVE_HOOK = this;
}
public static void main(String[] args) throws Throwable{
SAVE_HOOK = new FinalizeEscapeGc();
SAVE_HOOK = null;
System.gc();
Thread.sleep(5000);
//第一次逃脱
if(SAVE_HOOK != null){
SAVE_HOOK.isAlive();
}else{
System.out.println("no, i am dead:");
}
//第二次没有逃脱
SAVE_HOOK = null;
System.gc();
if(SAVE_HOOK != null){
SAVE_HOOK.isAlive();
}else{
System.out.println("no i am dead-------------");
}
}
}
备注:finalize()介绍
- finalize()作为根类Object的受保护方法.
- 当垃圾回收器确定不存在对该对象的更多引用时,由对象的垃圾回收器调用此方法。子类重写 finalize 方法,以配置系统资源或执行其他清除.
- 对于任何给定对象,Java 虚拟机最多只调用一次 finalize 方法
三,垃圾回收算法
1,标记--清除算法(Mark-Sweep)
- A,算法思路
该回收算法分为两个阶段 标记 和 清除
首先标记处所有需要回收的对象,在标记完成后统一回收所有被标记的对象.标记--清除是最基础的收集算法,后续的收集算法都是基于这种思路并对其不足进行改进而得到的
- B,算法的不足
-
效率问题
标记和清除的效率都不高 -
空间问题
标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作.
-
效率问题
2,复制算法
- A,算法思路
该算法是将可用内存按容量划分为大小相等的两块,每次只使用其中一块.当这块内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉.每次只对整个半区进行内存回收
-
B,算法优缺点
- 内存分配不必考虑内存碎片问题
- 内存分配简单高效
- 但是将可使用的内存减少到了原来的一半
-
C,算法的应用
- 在商业虚拟机中,都采用这种收集算法来回收新生代.新生代的大部分内存都是"朝生夕死"的,所以没必要按照1:1的比例来划分内存空间,而是将内存分为一块交大 的Eden(伊甸园)空间和两块较小的Survivor(from survivor, to survivor),每次使用Eden和from Survivor空间. 当回收时, 将Eden和from Survivor中还存活着的对象一次性地复制到另外to Survivor空间上,最后清理掉Eden和from Survivor空间.
- 但若出现Eden和from Survivor中存活的对象大于to Survivor怎么办呢?这就需要依赖其他内存进行(例如老年代)进行分配担保(Handle Promotion). 当to Survivor空间没有足够空间存放新生代收集下来的存活对象时,这些对象将直接通过分配担保机制进入老年代.
3,标记---整理(Mark-Compact)
- A,算法思路
该算法的标记过程仍然与"标记---清除"算法一样, 但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都想一端移动,然后直接清理掉端边界以外的内存.
-B,算法应用
主要应用老年代垃圾回收
4,分代收集算法
当前商业虚拟机的垃圾收集都采用"分代收集"算法,主要根据对象存活周期的不同内存划分为几块.一般把堆分为新生代和老年代,根据不同年代的特点采用最适当的收集算法.
在新生代中,由于每次垃圾收集时都会有大批对象死去,只有少量存活,那就选用复制算法.
在老年代中因为对象存活效率高,没有额外空间对它进行分配担保,就必须使用"标记---清理"或者"标记---整理"来进行回收
参考<<深入理解Java虚拟机 JVM高级特性与最佳实践 第二版 周志明>>