《深入理解Java虚拟机》-Java内存区域
本文大部分摘自《深入理解Java虚拟机(第二版)》
1. 运行时数据区域
Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域。Java虚拟机所管理的内存将会包括以下几个运行时数据区域,如下图所示:
Java虚拟机运行时内存模型.png
1.1 程序计数器
程序计数器是一块较小的内存空间,可以看作是当前线程所执行的字节码的行号指示器。字节码解释器通过改变计数器的值来选取下一条需要执行的字节码指令。
- 每条线程都有独立的程序计数器,互不影响;
- 正在执行的是Java方法,计数器记录的是正在执行的虚拟机字节码指令的地址;
- 正在执行的是Native方法,计数器值为空;
- 唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryError情况的区域;
1.2 Java虚拟机栈
Java虚拟机栈也是线程私有,生命周期和线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法被执行的时候都会创建一个栈帧,用于存储局部变量表、操作数栈、动态连接、方法出口等信息。
- 局部变量表:存放编译期可知的各种基本数据类型、对象引用和returnAddress类型。
- 操作数栈:基于栈的执行引擎,虚拟机把操作数栈作为它的工作区,大多数指令都要从这里弹出数据、执行运算,然后把结果压回操作数栈。
- 动态连接:每个栈帧都包含一个指向运行时常量池中该栈帧所属方法的引用,持有这个引用是为了支持方法调用过程中的动态连接。Class文件的常量池中存有大量的符号引用,字节码中的方法调用指令就以常量池中指向方法的符号引用为参数。这些符号引用一部分会在类加载阶段或第一次使用的时候转化为直接引用,这种转化称为静态解析。另外一部分将在每一次的运行期间转化为直接引用,这部分称为动态连接。
- 方法出口:返回方法被调用的位置,恢复上层方法的局部变量表和操作数栈,把返回值(如果有的话)压入调用者栈帧的操作数栈中。
1.3 本地方法栈
本地方法栈为虚拟机使用到的Native方法服务,而虚拟机栈为虚拟机执行Java方法服务。
1.4 Java堆
Java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。几乎所有的对象实例都在堆上分配内存。Java堆可以细分为新生代和老年代,新生代包括Eden区、From Survivor区和To Survivor区。
1.5 方法区
方法区和Java堆一样是各个线程共享的内存区域,用于存储已经被虚拟机加载的类信息、常量、静态常量、即时编译器编译后的代码数据等数据。
Hotspot虚拟机使用永久代来实现方法区,永久代和方法区并不等价。JDK1.7已经将常量池从永久代移出。
1.6 运行时常量池
运行时常量池是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有常量池用于存放编译期生成的各种字面量和符号引用。这部分内容将在类加载后进入方法区的运行时常量池存放。运行时常量池相对于Class文件常量池一个重要的特性就是具备动态性。参考String类intern的使用。
1.7 直接内存
- 直接内存并不是虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域,但是这部分内存也被频繁地使用。
- 在JDK1.4中新引入NIO类,引入了一种基于通道(Channel)与缓冲区(Buffer)的IO方式,使用Native方法直接分配堆外内存,通过DirectByteBuffer对象作为内存引用来操作,避免在Java堆和Native堆来回复制数据。
- 直接内存的分配不会受Java堆内存大小的限制,但是受本机总内存大小以及处理器寻址空间的限制。
2. Hotspot虚拟机对象
2.1 对象的创建
虚拟机遇到new指令:
- 检查指令的参数能否在常量池中定位到一个类的符号引用。
- 检查符号引用代表的类是否已被加载、解析和初始化过。
如果没有,先执行类的加载过程。
- 类加载检查通过后,为新生对象分配内存。对象所需内存大小在类加载完成后便可完全确定。内存分配方式有以下两种:
- 指针碰撞-内存规整
- 空闲列表-已使用和未使用的内存交错
对象创建在并发情况下并非线程安全的。有两种解决方案: - 对分配内存空间的动作进行同步处理。虚拟机采用CAS配上失败重试的方式。
- 内存分配的动作按线程划分不同的空间进行,每个线程从Java堆中预先分配一小块内存,称为本地线程分配缓冲TLAB。只有TLAB用完再分配新的TLAB时才需要同步锁定。
- 内存分配完成后,虚拟机需要对分配到的内存空间都初始化为零值(不包括对象头)。
- 虚拟机对对象进行必要的设置。例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息存放在对象头。
- 执行new指令后会接着执行init方法,进行初始化。
2.2 对象的内存布局
对象的内存布局可以分为3块区域:对象头(Header)、实例数据(Instance Date)和对齐数据(Padding)。
2.2.1 对象头
- 存储对象自身的运行时数据,如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。
- 类型指针,对象指向它的类元数据的指针,虚拟机通过这个指针确定这个对象是哪个类的实例。
- 如果对象是Java数组,对象头还必须有一块用于记录数组长度的数据。
2.2.2 实例数据
实例数据是对象真正存储的有效信息,也是程序代码中所定义的各种类型的字段内容。包括父类继承和子类定义。存储顺序受虚拟机分配策略参数和源码中定义顺序影响。
- 相同宽度的字段被分配到一起。
- 在父类中定义的变量出现在子类之前。
- 子类中较窄的变量可能会插入父类变量的空隙中(CompactFields参数值为true)。
2.2.3 对齐数据
对齐补充并不是必然存在,仅起着占位符的作用。对象大小必须是8字节的整数倍。对象头部分正好是8字节的倍数(1倍或2倍)。因此当对象实例数据没有对齐时,需要通过对齐填充来不全。
2.3 对象的访问定位
Java程序需要通过栈上的reference数据来操作堆上的具体对象。目前主流的访问方式有使用句柄和直接指针两种。
2.3.1 使用句柄
Java堆中划分出一块内存作为句柄池,reference对象存储的是句柄地址。句柄中包含对象实例数据和对象类型数据的指针。如下图所示:
使用句柄访问对象.png
2.3.2 直接指针
如果使用直接指针方式访问,Java堆对象的布局就必须考虑如何放置访问类型数据的相关信息。reference直接存储对象的地址。如下图所示:
使用直接指针访问对象.png
2.3.3 总结
- 使用句柄方式最大的好处是reference存储的稳定的句柄地址,在对象被移动时只会改变句柄中的实例数据指针,而reference本身不需要修改。
- 使用直接指针访问最大的好处是更快,节省了一次指针定位的时间开销。