JVM笔记——java内存区域
1 运行时的数据区域
JVM在执行java程序时会将它管理的内存区域划分为若干个不同的数据区域。在JDK1.8和之前的版本略有不同。
JDK1.8之前的数据区域.png JDK1.8的数据区域.png
在JDK1.8中方法区的实现从永久代变为元空间,并直接使用内存
线程私有的为:虚拟机栈、本地方法栈、程序技术器
线程共享的为:堆、方法区、直接内存
1.1 程序计数器
程序技术器时一快较小的内存空间,可以看成当前线程执行字节码的行号指示器。主要有两个作用:
- 字节码解释器通过改变程序计数器来依次读取指令,从而实现代码的流程控制,如:分支、循环、跳转、线程恢复、异常处理。
- 在多线程情况下程序计数器将记录当前程序执行到的位置,当切换线程时可以从此处执行。
程序计数器是唯一一个不会出现 OutOfMemoryError 的内存区域,它的生命周期随着线程的创建而创建,随着线程的结束而死亡。
1.2 Java虚拟机栈
通常所说的栈就是指的虚拟机栈,或者说是虚拟机栈中的局部变量表部分。
虚拟机栈描述的是java方法执行的内存模型,每个方法在执行的同时会创建一个栈帧用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每个方法从调用到完成就对应着栈帧在虚拟机栈中出栈入栈的过程。
局部变量表存放了编译期可知的8种基本类型、对象的引用(reference类型,指向对象起始地址的引用指针或者指向一个代表对象的句柄或其他与此对象相关的位置);局部变量表的空间分配在编译时就完成分配,在方法运行时不会改变其大小。
当线程请求的栈的深度大于虚拟机栈允许的深度会报StackOverflowError。
当栈动态扩展无法申请到足够内存时就会报OutOfMemoryError。
1.3 本地方法栈
本地方法栈与虚拟机栈的作用较为类似,区别在于虚拟机栈为虚拟机执行Java方法(字节码)服务,本地方法栈为虚拟机使用到的Native方法服务,HotSpot中将二者合二为一。
本地方法被执行的时候,在本地方法栈也会创建一个栈帧,用于存放该本地方法的局部变量表、操作数栈、动态链接、出口信息。
方法执行完毕后相应的栈帧也会出栈并释放内存空间,也会出现 StackOverFlowError 和 OutOfMemoryError 两种错误。
1.4 java堆
java堆是jvm管理内存中最大的一块,被所有线程所共享,虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,几乎所有的对象实例以及数组都在这里分配内存。
Java世界中“几乎”所有的对象都在堆中分配,但是从jdk 1.7开始已经默认开启逃逸分析,如果某些方法中的对象引用没有被返回或者未被外面使用(也就是未逃逸出去),那么对象可以直接在栈上分配内存。
java堆是垃圾收集管理的主要区域,很多时候被称为GC堆;从内存回收角度来看,java堆可以细分为新生代和老年代;再细致一点有Eden空间、From Survivor空间、To Survivor空间等。
java堆可以处在物理上不连续的内存 空间中,只要逻辑上连续即可。
1.5 方法区
方法区也是各线程共享的内存区域,用于存储已被虚拟机啊加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。虽然 Java 虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做 Non-Heap(非堆),目的应该是与 Java 堆区分开来。
方法区可以选择不实现垃圾收集,但不意味着数据进入了该区域就能永久存在。当方法区无法满足内存分配需求时也会报OutOfMemoryError异常。
方法区也被称为永久代。
1.5.1 方法区与永久代的关系
方法区与永久代类似java中接口与类的关系,而永久代就是 HotSpot 虚拟机对虚拟机规范中方法区的一种实现方式。永久代是 HotSpot 的概念,方法区是 Java 虚拟机规范中的定义,其他的虚拟机实现并没有永久代这一说法。
JDK 1.8 的时候,方法区(HotSpot 的永久代)被彻底移除了,取而代之是元空间,元空间使用的是直接内存。
1.5.2 为什么要将永久代替换为元空间
- 永久代有个jvm设置的最大空间上限,无法调整;而元空间直接使用内存,受本机可用内存限制,内存溢出几率比原来小
- 元空间里面存放的是类的元数据,空间受本机可用内存限制,加载的类就更多
- JDK8,合并了 HotSpot 和 JRockit 的代码, JRockit 从来没有永久代, 合并之后就没有必要额外的设置这么一个永久代。
1.6 运行时常量池
运行时常量池时方法区的一部分,用于存放编译期生成的各种字面量和符号引用;也有outOfMemoryError异常。
1.7 直接内存
直接内存并不是虚拟机运行时数据区的一部分,也不是虚拟机规范中定义的内存区域,但是这部分内存也被频繁地使用。而且也可能导致 OutOfMemoryError 错误出现。
本机直接内存的分配不会受到 Java 堆的限制,但是,既然是内存就会受到本机总内存大小以及处理器寻址空间的限制。
2 对象
2.1 对象的创建
对象创建的过程.png-
类加载检查
虚拟机遇到new指令时,首先去检查这个指令的参数是否能在常量池中定位到这个类的符号引用,并且检查这个符号引用代表的类是否已被加载过、解析和初始化过。如果没有,那必须先执行相应的类加载过程。 -
分配内存
对象所需的内存大小在类加载检查完成后便确定,有两种分配方式指针碰撞和空闲列表。
-
指针碰撞:假设java堆中内存规整,用过的内存和空闲的内存分别放在两边,中间放着指针作为分界点的指示器,分配时仅将指针像空闲空间移动有对象大小相等的距离。
-
空闲列表:java堆中内存并不规整,用过的内存和空闲的内存相互交错,虚拟机维护一个列表,记录哪些内存块可用,分配时找出一块足够大的空间划给对象实例,并更新列表上的记录 。
采用哪一种,取决于 Java 堆内存是否规整。而 Java 堆内存是否规整,取决于 GC 收集器的算法是"标记-清除",还是"标记-整理"(也称作"标记-压缩"),值得注意的是,复制算法内存也是规整的
在创建对象的时候有一个很重要的问题,就是保证对象创建频繁时的线程安全
-
CAS+失败重试: CAS 是乐观锁的一种实现方式。所谓乐观锁就是,每次不加锁而是假设没有冲突而去完成某项操作,如果因为冲突失败就重试,直到成功为止。虚拟机采用 CAS 配上失败重试的方式保证更新操作的原子性。
-
TLAB: 为每一个线程预先在 Eden 区分配一块儿内存,JVM 在给线程中的对象分配内存时,首先在 TLAB 分配,当对象大于 TLAB 中的剩余内存或 TLAB 的内存已用尽时,再采用上述的 CAS 进行内存分配
-
初始化零值
内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零值(不包括对象头),这一步操作保证了对象的实例字段在 Java 代码中可以不赋初始值就直接使用,程序能访问到这些字段的数据类型所对应的零值。 -
设置对象头
初始化零值完成之后,虚拟机要对对象进行必要的设置,例如这个对象是那个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的 GC 分代年龄等信息。 这些信息存放在对象头中。 另外,根据虚拟机当前运行状态的不同,如是否启用偏向锁等,对象头会有不同的设置方式。 -
执行init方法
执行 new 指令之后会接着执行 <init> 方法,把对象按照程序员的意愿进行初始化,这样一个真正可用的对象才算完全产生出来。
2.2 对象的内存布局
在HotSpot虚拟机中,对象的存储布局可以分为三部分:对象头、实例数据、对齐填充。
-
对象头包括两部分信息,第一部分用于存储自身的运行时数据(哈希码、GC分代年龄等);另一部分是类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是那个类的实例
-
实例数据部分是对象存储的真正有效信息,也是程序代码中所定义的各种类型的字段内容
-
对齐填充并不是必然存在的,仅代表占位符的作用
2.3 对象的访问定位
需要用过栈上的reference数据来操作堆上的具体对象,reference类型只规定了一个 指向对象的引用,并没有定义这个引用应该通过什么方式去定位、访问堆中对象的具体位置,对象的访问方式由虚拟机实现而定,目前主流的访问方式有使用句柄和直接指针两种:
- 使用句柄,java堆会划分出一块内存作为句柄池,reference中存储就是对象的句柄,句柄中存放了对象的实例数据和类型数据各自的地址信息。 通过句柄访问数据.png
-
直接指针,那么 Java 堆对象的布局中就必须考虑如何放置访问类型数据的相关信息,而 reference 中存储的直接就是对象的地址。
通过直接指针访问对象.png
比较:
- 通过句柄访问的好处就是reference中存储的是稳定的句柄地址,在对象被移动时只会改变地址中的实例数据指针,reference本身不需要修改
- 通过直接指针访问的好处就是速度快,节省了一次指针定位的时间开销