Java虚拟机
1. Java内存区域
答:
Java虚拟机运行时数据区
(1) Java堆(线程共享)
- 是JVM所管理的内存中最大的一块。
- 在虚拟机启动时创建。
- 唯一目的就是存放对象,几乎所有的类实例和数组都要在堆上分配。
- Java 堆是垃圾收集器管理的主要区域,因此很多时候也被称为“GC 堆”。
- Java 堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。
- 在实现时,既可以实现成固定大小的,也可以是可扩展的;当前主流的虚拟机都是按照可扩展来实现的(通过 -Xmx 和 -Xms 控制)。
- 如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出 OutOfMemoryError 异常。
(2) 方法区(线程共享)
- 用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
- 除了和 Java 堆一样不需要连续的内存和可以选择固定大小或者可扩展外,还可以选择不实现垃圾回收。
- 相对而言,垃圾回收行为在这个区域是比较少出现的;这区域的内存回收目标主要是针对常量池的回收和对类型的卸载。
- 当方法区无法满足内存分配需求时,将抛出 OutOfMemoryError 异常。
运行时常量池
- 是方法区的一部分。
- Class 文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Constant Pool Table),用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。
- 对于运行时常量池,Java 虚拟机规范没有做任何细节的要求。不过,一般来说,除了保存 Class 文件中描述的符号引用外,还会把翻译出来的直接引用也存储在运行时常量池中。
- 运行时常量池相对于 Class 文件常量池的另外一个重要特征是具备动态性,Java 语言并不要求常量一定只有编译期才能产生,也就是并非预置入 Class 文件中常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中,这种特性被开发人员利用得比较多的便是 String 类的 intern() 方法。
- 当运行时常量池无法再申请到内存时会抛出 OutOfMemoryError 异常。
(3) Java虚拟机栈(线程私有)
- 生命周期与线程相同。
- 描述的是 Java 方法执行的内存模型:每个方法在执行时都会创建一个栈帧,用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。
- 局部变量表存放了编译期可知的各种基本数据类型(boolean、char、byte、short、int、long、double)、对象引用(reference 类型)和 returnAddress 类型(指向了一条字节码指令的地址)。
- 如果线程请求的栈深度大于虚拟机所允许的深度,将抛出 StackOverflowError 异常。
- 如果虚拟机栈可以动态扩展(当前大部分的 Java 虚拟机都可动态扩展,只不过 Java 虚拟机规范中也允许固定长度的虚拟机栈),如果扩展时无法申请到足够的内存,就会抛出 OutOfMemoryError 异常。
(4) 本地方法栈(线程私有)
- 与虚拟机栈所发挥的作用是非常相似的,区别在于,虚拟机栈为虚拟机执行 Java 方法(也就是字节码)服务,而本地方法栈则为虚拟机使用到的 native 方法服务。
- 与虚拟机栈一样,本地方法栈区域也会抛出 StackOverflowError 和 OutOfMemoryError 异常。
(5) 程序计数器(线程私有)
- 一块较小的内存空间,可以看作是当前线程所执行的字节码的行号指示器。
- 在虚拟机的概念模型里,字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成。
- 为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间计数器互不影响,独立存储,这类内存区域我们称之为“线程私有”的内存。
- 此内存区域是唯一一个在 Java 虚拟机规范中没有规定任何 OutOfMemoryError 情况的区域。
2. Java内存模型
Java 内存模型(Java Memory Model,JMM),用来屏蔽掉各种硬件和操作系统的内存访问差异,以实现让 Java 程序在各种平台下都能达到一致的内存访问效果。
主要目标:定义程序中各个变量的访问规则,即在虚拟机中将变量存储到内存和从内存中取出变量这样的底层细节。
注意:此处的变量与Java编程中所说的变量有所区别,它包括了实例字段、静态字段和构成数组对象的元素,但不包括局部变量与方法参数,因为后者是线程私有的,不会被共享,自然就不会存在竞争问题。
主内存与工作内存
Java 内存模型规定了所有的变量都存储在主内存(Main Memory)中。
每条线程还有自己的工作内存(Working Memory),线程的工作内存中保存了被该线程使用到的变量的主内存副本拷贝,线程对变量的所有操作(读取、赋值等)都必须在工作内存中进行,而不能直接读写主内存中的变量。
不同的线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成。
线程、工作内存、主内存三者的交互关系如下图所示:
注意:
这里所讲的主内存、工作内存与前面所讲的 Java 内存区域中的 Java 堆、栈、方法区等并不是同一个层次的内存划分,两者基本上是没有关系的。
- 如果两者一定要勉强对应起来的话,那从变量、主内存、工作内存的定义来看,主内存主要对应于 Java 堆中的类实例数据部分,而工作内存则对应于虚拟机栈中的部分区域。
- 从更低层次上说,主内存就直接对应于物理硬件的内存,而为了获取更好的运行速度,虚拟机可能会让工作内存优先存储于寄存器和高速缓存中,因为程序运行时主要访问读写的是工作内存。
内存间交互操作
关于主内存与工作内存之间具体的交互协议,即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步回主内存之类的实现细节,Java 内存模型中定义了以下8种操作来完成,虚拟机实现时必须保证下面提及的每一种操作都是原子的、不可再分的。
- lock(锁定):作用于主内存的变量,它把一个变量标识为一条线程独占的状态。
- unlock(解锁):作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定。
- read(读取):作用于主内存的变量,它把一个变量的值从主内存传输到线程的工作内存中,以便随后的 load 操作使用。
- load(载入):作用于工作内存的变量,它把 read 操作从主内存中得到的变量的值放入工作内存的变量副本中。
- use(使用):作用于工作内存的变量,它把工作内存中一个变量的值传递给执行引擎,每当虚拟机遇到一个需要使用到变量的值的字节码指令时将会执行这个操作。
- assign(赋值):作用于工作内存的变量,它把一个从执行引擎接收到的值赋给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
- store(存储):作用于工作内存的变量,它把工作内存中一个变量的值传送到主内存中,以便随后的 write 操作使用。
- write(写入):作用于主内存的变量,它把 store 操作从工作内存中得到的变量的值放入主内存的变量中。
Java 内存模型还规定了在执行上述8种基本操作时必须满足如下规则:
- 不允许 read 和 load、store和 write 操作之一单独出现,即不允许一个变量从主内存读取了但工作内存不接受,或者从工作内存发起回写了但主内存不接受的情况出现。
- 不允许一个线程丢弃它的最近的 assign 操作,即变量在工作内存中改变了之后必须把该变化同步
3. 类加载机制
定义
虚拟机把描述类的数据从 Class 文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的 Java 类型,这就是虚拟机的类加载机制。
4. 如何判断一个对象是否存活?
在堆里面存放着 Java 世界中几乎所有的类实例,垃圾收集器在对堆进行回收前,第一件事情就是要确定这些对象中哪些还“存活”着,哪些已经“死去”(即不可能再被任何途径使用的对象)。