28-字节码指令
一、概述
- Java字节码对于虚拟机,就好像汇编语言对于计算机,属于基本执行指令
- Java虚拟机的指令由“一个字节长度”的、代表着某种特定操作含义的数字(称为 操作码,Opcode)以及跟随其后的零至多个代表此操作所需参数(称为操作数,Operands)而构成。由于Java虚拟机采用面向操作数栈而不是寄存器的结构,所以大多数的指令都不包含操作数,只有一个操作码
- 由于限制了 Java 虚拟机操作码的长度为一个字节(0~255),这意味着指令集的操作码总数不可能超过 256 条
- 熟悉虚拟机的指令对于动态字节码生成、反编译 Class 文件、Class文件修补都有着非常重要的价值。因此阅读字节码作为了解 Java 虚拟机的基础技能,需要熟练掌握常见指令
- 如果不考虑异常处理的话,那么Java虚拟机的解释器可以使用下面这个伪代码当做最基本的执行模型来理解
do {
自动计算PC寄存器的值加1;
根据PC寄存器的指示位置,从字节码流中取出操作码;
if(字节码存在操作数)从字节码流中取出操作数;
执行操作码所定义的操作;
}while(字节码长度 > 0)
二、字节码与数据类型
在Java虚拟机的指令集中,大多数的指令都包含了其操作所对应的数据类型信息。如 iload 指令用于从局部变量表中加载 int 类型的数据到“操作数栈”中,而fload指令加载的则是 float 类型的数据
1、对于大部分与数据类型相关的字节码指令,它们的操作码助记符中都有特殊的字符来表名专门为哪种数据类型服务
- i:代表 int 类型的数据操作
- l:代表 long 类型的数据操作
- s:代表 short 类型的数据操作
- b:代表 byte 类型的数据操作
- c:代表 char 类型的数据操作
- f:代表 float 类型的数据操作
- d:代表 double 类型的数据操作
- 也有一些指令的助记符中没有明确指明操作类型的字母(arraylength指令),它没有代表数据类型的特殊字符,但是操作数永远只能是一个数组类型的对象
- byte、char、short、boolean类型数据转为 int 类型数据
2、指令分类
- 加载与存储指令
- 算术指令
- 类型转换指令
- 对象的创建与访问指令
- 方法调用与返回指令
- 操作数栈管理执行
- 比较控制指令
- 异常处理指令
- 同步控制指令
3、做值相关操作时
- 一个指令,可以从局部变量表、常量池、堆中对象、方法调用、系统调用中等取得数据,这些数据(可能是值、可能是对象的引用)被压入操作数栈
- 一个指令,也可以从操作数栈中取出一到多个值(pop多次),完成赋值、加减乘除、方法传参、系统调用等等操作
三、加载与存储指令
1、作用
- 加载和存储指令用于将数据从栈帧的局部变量表和操作数栈之间来回传递
2、常用指令
- 局部变量压栈指令:将一个局部变量加载到操作数栈:xload、xload_<n>(其中x为 i、l、f、d、a;n为 0~3)
- 常量入栈指令:将一个常量加载到操作数栈:bipush、sipush、ldc、ldc_w、ldc2_w、aconst_null、iconst_m1、iconst_<i>、lconst_<l>、fconst_<f>、dconst_<d>
- 出栈装入局部变量表指令:将一个数值从操作数栈存储到局部变量表:xstore、xstore_<n>(其中x为i、l、f、d、a;n为0~3);xastore(其中x为i、l、f、d、a、b、c、s)
- 扩充局部变量表的访问索引的指令:wide
3、说明
- 有一部分指令助记符是以尖括号结尾的(iload_<n>)。这些指令助记符实际上代表了一组指令(如:iload_<n>代表了iload_0、iload_1、iload_2和iload_3这几个指令)。这几组指令都是某个带有一个操作数的通用指令(如iload)的特殊形式,对于这若干组特殊指令来说,它们表面上没有操作数,不需要进行取操作数的动作,但操作数都隐含在指令中
- iload_0的语义与操作数为0时的 iload 指令语义完全一致。在尖括号之间的字母指定了指令隐含操作数的数据类型
- <n>:代表非负的整数
- <i>:代表是 int 类型数据
- <l>:代表long类型
- <f>:代表float类型
- <d>:代表double类型
- 操作 byte、char、short和boolean类型数据时,经常用int类型的指令来表示
- iload_0:代表将局部变量表中索引为0位置的数据压入操作数栈中
- iload 0:代表将局部变量表中索引为0位置的数据压入操作数栈中
- iload 4:代表将局部变量表中索引为4位置的数据压入操作数栈中
4、操作数栈(Operand Stack)
-
Java字节码是Java虚拟机所使用的指令集。因此,它与Java虚拟机基于栈的计算模型是密不可分的。在解释执行过程中,每当为Java方法分配栈帧时,Java虚拟机往往需要开辟一块额外的空间作为“操作数栈,来存放计算的操作数以及返回结果”
image.png
5、局部变量表(Local Variables)
- Java方法栈帧的另外一个重要组成部分则是局部变量区,字节码程序可以将计算的结果缓存在局部变量区之中。实际上,Java虚拟机将局部变量区当成一个数组,依次存放 this 指针(仅非静态方法),所传入的参数,以及字节码中的局部变量
-
long类型以及double类型的值将占据两个单元,其余类型仅占据一个单元
image.png - 在栈帧中,与性能调优关系最为密切的部分就是局部变量表。局部变量表中的变量也是重要的垃圾回收根节点,只要被局部变量表中直接或间接引用的对象都不会被回收
- 代码
public class LoadAndStoreTest {
public void load(int num, Object obj, long count, boolean flag, short[] arr) {
System.out.println("num = " + num);
System.out.println("obj = " + obj);
System.out.println("count = " + count);
System.out.println("flag = " + flag);
System.out.println("arr = " + arr);
}
}
- 字节码
0 getstatic #2 <java/lang/System.out>
3 new #3 <java/lang/StringBuilder>
6 dup
7 invokespecial #4 <java/lang/StringBuilder.<init>>
10 ldc #5 <num = >
12 invokevirtual #6 <java/lang/StringBuilder.append>
15 iload_1
16 invokevirtual #7 <java/lang/StringBuilder.append>
19 invokevirtual #8 <java/lang/StringBuilder.toString>
22 invokevirtual #9 <java/io/PrintStream.println>
25 getstatic #2 <java/lang/System.out>
28 new #3 <java/lang/StringBuilder>
31 dup
32 invokespecial #4 <java/lang/StringBuilder.<init>>
35 ldc #10 <obj = >
37 invokevirtual #6 <java/lang/StringBuilder.append>
40 aload_2
41 invokevirtual #11 <java/lang/StringBuilder.append>
44 invokevirtual #8 <java/lang/StringBuilder.toString>
47 invokevirtual #9 <java/io/PrintStream.println>
50 getstatic #2 <java/lang/System.out>
53 new #3 <java/lang/StringBuilder>
56 dup
57 invokespecial #4 <java/lang/StringBuilder.<init>>
60 ldc #12 <count = >
62 invokevirtual #6 <java/lang/StringBuilder.append>
65 lload_3
66 invokevirtual #13 <java/lang/StringBuilder.append>
69 invokevirtual #8 <java/lang/StringBuilder.toString>
72 invokevirtual #9 <java/io/PrintStream.println>
75 getstatic #2 <java/lang/System.out>
78 new #3 <java/lang/StringBuilder>
81 dup
82 invokespecial #4 <java/lang/StringBuilder.<init>>
85 ldc #14 <flag = >
87 invokevirtual #6 <java/lang/StringBuilder.append>
90 iload 5
92 invokevirtual #15 <java/lang/StringBuilder.append>
95 invokevirtual #8 <java/lang/StringBuilder.toString>
98 invokevirtual #9 <java/io/PrintStream.println>
101 getstatic #2 <java/lang/System.out>
104 new #3 <java/lang/StringBuilder>
107 dup
108 invokespecial #4 <java/lang/StringBuilder.<init>>
111 ldc #16 <arr = >
113 invokevirtual #6 <java/lang/StringBuilder.append>
116 aload 6
118 invokevirtual #11 <java/lang/StringBuilder.append>
121 invokevirtual #8 <java/lang/StringBuilder.toString>
124 invokevirtual #9 <java/io/PrintStream.println>
127 return
- LocalVariableTable image.png
1、常量入栈指令
- 常量入栈指令的功能是将常数压入操作数栈,根据数据类型和入栈内容的不同,又可以分为const系列、push系列和ldc指令
1、指令const系统
- 用于对特定的常量入栈,入栈的常量隐含在指令本身里
- iconst_<i>(i从-15)(如:iconst_m1将-1压入操作数栈;iconst_x(x为05)将x压入栈)
- lconst_<l>(l从0~1)(如:lconst_0、lconst_1分别将长整型0和1压入栈)
- fconst_<f>(f从0~2)(如:fconst_0、fconst_1、fconst_2分别将浮点数0、1、2压入栈)
- dconst_<d>(d从0~1)(dconst_0和dconst_1分别将double型的0和1压入栈)
- aconst_null(将 null 压入操作数栈)
- 指令助记符的第一个字符表示数据类型
- i:表示整数
- l:表示长整数
- f:表示浮点数
- d:表示双精度浮点
- a:表示对象引用
- 指令隐含操作的参数会以下划线形式给出
2、指令push系统
- 主要包括 bipush 和 sipush
- bipush:接收8位整数作为参数
- sipush:接收16位整数作为参数
3、指令ldc系统
- 如果以上指令都不能满足需求,那么可以使用万能的ldc指令,它可以接受一个 8 位的参数,该参数指向常量池中的int、float或者String的索引,将指定的内容压入堆栈
4、指令ldc_w系统
- 类似于ldc,它接收两个8位参数,能支持的索引范围大于ldc。如果要压入的元素是long或者double类型的,则使用ldc2_指令
5、总结 image.png
- 代码
public class LoadAndStoreTest {
// 2、常量入栈指令
public void pushConstLdc() {
int i = -1;
int a = 5;
int b = 6;
int c = 127;
int d = 128;
int e = 32767;
int f = 32768;
}
}
- 字节码
0 iconst_m1
1 istore_1
2 iconst_5
3 istore_2
4 bipush 6
6 istore_3
7 bipush 127
9 istore 4
11 sipush 128
14 istore 5
16 sipush 32767
19 istore 6
21 ldc #2 <32768>
23 istore 7
25 return
- 小结
- 1、常量-1使用iconst_m1表示
- 2、常量6无法使用iconst_表示范围,所以使用bipush 6来存储
- 3、bipush可以表示的最大8位数为127(bipush 127),大于127的使用接收16位参数的sipush(sipush 128)
- 4、sipush接收的16位参数最大值为32767(sipush 32767),超出的使用ldc
2、出栈转入局部变量表指令
-
出栈装入局部变量表指令用于将操作数栈中栈顶元素弹出后,装入局部变量表的指定位置,用于给局部变量赋值
-
这里指令主要以store的形式存在,比如xstore(x为i、l、f、d、a)、xstore_n(x为i、l、f、d、a,n为0~3)
- 其中,指令istore_n将从操作数栈中弹出一个整数,并把它赋值给局部变量索引n位置
- 指令xstore由于没有隐含参数信息,故需要提供一个byte类型的参数类指定目标局部变量表的位置
-
一般来说,类似像store这样的命令需要带一个参数,用来指明将弹出的元素放在局部变量表的第几个位置。但是为了尽可能压缩指令大小,使用专门的istore_1指令表示将弹出的元素放置在局部变量表第1个位置。类似的还有istore_0、istore_1、istore_2、istore_3,它们分别表示从操作数栈顶弹出一个元素,存放在局部变量表第0、1、2、3个位置。由于局部变量表前几个位置总是非常常用,因此这种做法虽然增加了指令数量,但是可以大大压缩生成的字节码的体积。如果需要存储的槽位大于3,那么可以使用istore指令,外加一个参数,用来表示需要存放的槽位位置
四、算术指令
1、运算时的溢出:数据运算可能会导致溢出,例如两个很大的正整数相加,结果可能是一个负数。Java虚拟机规范并无明确规定过整型数据溢出的具体结果,仅规定了在处理整型数据时,只有除法指令以及求余指令中当出现除数为0时会导致虚拟机抛出异常 ArithmeticException
- code
@Test
public void method1() {
int i = 0;
int j = i / 0;
System.out.println(j);
}
- 输出
java.lang.ArithmeticException: / by zero
- code
@Test
public void method2() {
int i = 10;
double j = i / 0.0;
System.out.println(j);
}
- 输出
Infinity
- code
@Test
public void method3() {
int i = 0;
double j = i / 0.0;
System.out.println(j);
}
- 输出
NaN
2、运算模式
- 向最接近数舍如模式(四舍五入):JVM要求在进行浮点数计算时,所有的运算结果都必须舍入到适当的精度,非精确结果必须舍入为可被标识的最接近的精确值,如果有两种可表示的形式与该值一样接近,将优先选择最低有效位为零的。
- 向零舍入模式(取整):将浮点数转换为整数时,采用该模式,该模式将在目标数值类型中选择一个最接近但是不大于原值的数字作为最精确的舍入结果
3、NaN值使用:当一个操作产生溢出时,将会使用有符号的无穷大表示,如果某个操作结果没有明确的数学定义的话,将会使用NaN值来表示。而且所有使用NaN值作为操作数的算术操作,结果都会返回 NaN
4、所有算术指令
- 加法指令:iadd、ladd、fadd、dadd
- 减法指令:isub、lsub、fsub、dsub
- 乘法指令:imul、lmul、fmul、dmul
- 除法指令:idiv、ldiv、fdiv、ddiv
- 求余指令:irem、lrem、frem、drem
- 取反指令:ineg、lneg、fneg、dneg
- 自增指令:iinc
- 位运算指令:
- 位移指令:ishl、ishr、iushr、lshl、lshr、lushr
- 按位或指令:ior、lor
- 按位与指令:iand、land
- 按位异或指令:ixor、lxor
- 比较指令:dcmpg、dcmpl、fcmpg、fcmpl、lcmp
实例
1、实例1:float 取反指令
- 代码
@Test
public void method4() {
float i = 10;
float j = -i;
i = -j;
}
- 字节码
0 ldc #2 <10.0>
2 fstore_1
3 fload_1
4 fneg
5 fstore_2
6 fload_2
7 fneg
8 fstore_1
9 return
-
代码执行流程
- 0 ldc #2 <10.0>:把float类型的常量10.0存入“操作数栈” image.png
- 2 fstore_1:操作数出栈存入到局部变量表下标为1的位置 image.png
- 3 fload_1:加载局部变量表中数据到操作数栈 image.png
- 4 fneg:取出操作数栈栈顶元素取反 image.png
- 5 fstore_2:操作数栈栈顶数据存储到局部变量表下标为2的位置上 image.png
- 6 fload_2:加载局部变量表位置2的数据到操作数栈中 image.png
- 7 fneg:取出操作数栈栈顶元素取反 image.png
- 8 fstore_1:取出操作数栈栈顶元素存储到局部变量表下标为1的位置 image.png
2、实例2:i = i + 10 与 i += 10;
- 代码
@Test
public void method5() {
int i = 100;
i = i + 10;
}
- 字节码
0 bipush 100
2 istore_1
3 iload_1
4 bipush 10
6 iadd
7 istore_1
8 return
- 0 bipush 100:把100放入操作数栈 image.png
- 2 istore_1:把操作数栈栈顶元素数据存入局部变量表下标为1的位置 image.png
- 3 iload_1:加载局部变量表下标1中的数据放入到操作数栈 image.png
- 4 bipush 10:把常量10放入操作数栈 image.png
- 6 iadd:取出操作数栈前2位数据相加后再放入操作数栈 image.png
- 7 istore_1:把操作数栈顶元素存储到局部变量表下标为1的位置 image.png
:i += 10;
- 代码
public void method5() {
int i = 100;
i += 10;
}
- 字节码
0 bipush 100
2 istore_1
3 iinc 1 by 10
6 return
- 0 bipush 100:把100放入操作数栈 image.png
- 2 istore_1:把操作数栈栈顶元素数据存入局部变量表下标为1的位置 image.png
- 3 iinc 1 by 10:局部变量下标为1的数据加10 image.png
3、关于i++ 和 ++i
3.1、分析++i
- 代码
/**
* 关于(前)++i 和 (后)i++
*/
public void method6() {
int i = 10;
++i;
}
- 字节码
0 bipush 10
2 istore_1
3 iinc 1 by 1
6 return
- 0 bipush 10:常量10入操作数栈 image.png
- 2 istore_1:操作数栈栈顶数据存放到局部变量表下标为1的位置 image.png
- 3 iinc 1 by 1:局部变量表下标1的数据+1 image.png
3.2、i++字节码分析结果与++i一样 image.png
实例4 int a = i++;
- 代码
public void method7() {
int i = 10;
int a = i++;
}
- 字节码
0 bipush 10
2 istore_1
3 iload_1
4 iinc 1 by 1
7 istore_2
8 return
- 0 bipush 10:把常量10加载到操作数栈 image.png
- 2 istore_1:把操作数栈顶数据存储到局部变量表下标为1的位置上 image.png
- 3 iload_1:加载局部变量表下标为1的数据到操作数栈中 image.png
- 4 iinc 1 by 1:局部变量表下标为1的数据加1 image.png
- 7 istore_2:将操作数栈顶数据存入到局部变量表下标为2的位置 image.png
实例5:int a = ++i
- 代码
public void method8() {
int i = 10;
int a = ++i;
}
- 字节码
0 bipush 10
2 istore_1
3 iinc 1 by 1
6 iload_1
7 istore_2
8 return
- 0 bipush 10:常量10载入操作数栈 image.png
- 2 istore_1:将操作数栈顶数据存储到局部变量表下标为1的位置中 image.png
- 3 iinc 1 by 1:局部变量表下标为1的数据+1 image.png
- 6 iload_1:加载局部变量表下标1中数据到操作数栈中 image.png
- 7 istore_2:将操作数栈中的数据存储到局部变量表下标为2的位置中 image.png
4、比较指令
- 比较指令的作用是比较两个元素的大小,并将比较结果入栈
- 比较指令:
- dcmpg
- dcmpl
- fcmpg
- fcmpl
- lcmp
- 首字符d表示double类型,f表示float类型,l表示long类型
- 对于double和float类型的数字,由于NaN的存在,各有两个版本的比较指令,两个版本的指令针对NaN值,处理结果不同
- 指令fcmpg和fcmpl都从栈中弹出两个操作数,并将它们做比较,设栈顶的元素为v2,第2位的元素为v1,如果v1=v2,则压入0;若v1>v2则压入1;若v1<v2则压入-1
- 如果遇到NaN值,fcmpg会压入1,而fcmpl会压入-1
五、类型转换指令
1类型转换指令说明
- 类型转换指令可以将两种不同的数组类型进行相互转换
- 这些转换操作一般用于实现用户代码中的“显式类型转换操作”,或者用来处理“字节码指令集中数据类型相关指令”无法与“数据类型”一一对应的问题
2、宽化类型转换(Widening Numeric Conversions)
2.1、转换规则
- Java虚拟机直接支持以下数值的宽化类型转换(小范围类型向大范围类型的安全转换)。也就是,并不需要指令执行。
- 从int类型-->long、float或者double类型。对应指令为:i2l、i2f、i2d
- 从long类型-->float、double类型。对应指令为:l2f、l2d
- 从float类型-->double类型。对应指令为:f2d
- 小结:int ---> long ---> float ---> double
2.2、精度损失问题
-
宽化类型转换是不会因为超过目标类型最大值而丢失信息的。例如:从 int 类型到 long ,或者从int类型到double,都不会丢失任何信息,转换前后的值是精度相等的
-
从 int、long类型数据转换到 float,或者 long 类型数值转换到 double 时,将可能发生精度丢失——可能丢失掉几个最低有效为上的值,转换后的浮点数值是根据IEEE754最接近舍入模式所得到的正确整数值
-
尽管“宽化类型转换”实际上是可能发生精度丢失的,但是这种转换永远不会导致Java虚拟机抛出运行时异常
-
从byte、char和short类型到int类型的“宽化类型转换”实际上是不存在的。对于byte类型转为int,虚拟机并没有做实质性的转化处理,只是简单地通过操作数栈交换了两个数据。而将byte转为long时,使用的是i2l,可以看到在内部byte在这里已经等同于int类型处理,类似的还有short类型,这种处理方式有两个特点:
- 特点1:一方面可以减少实际的数据类型,如果为short和byte都准备一套指令,那么指令的数量就会大增,而“虚拟机目前的设计上,只愿意使用一个字节表示指令,因此指令总数不能超过256个,为了节省指令资源,将short和byte当做int处理也是情理之中”
- 特点2:另一方面,由于局部变量表中槽位固定为32位,无论是byte或者short存入局部变量表,都会占用32位空间。从这个角度来看,也没有必要特意区分这几种数据类型
2.3、实例测试
- 代码
package com.lkty.loadandstore;
/**
* 类型转换指令
*/
public class ClassCastTest {
/**
* 宽化类型转换
*/
public void upCast1() {
int i = 10;
long l = i;
float f = i;
double d = i;
float f1 = l;
double d1 = l;
double d2 = f1;
}
}
- 字节码
0 bipush 10
2 istore_1
3 iload_1
4 i2l
5 lstore_2
6 iload_1
7 i2f
8 fstore 4
10 iload_1
11 i2d
12 dstore 5
14 lload_2
15 l2f
16 fstore 7
18 lload_2
19 l2d
20 dstore 8
22 fload 7
24 f2d
25 dstore 10
27 return
- 0 bipush 10:将常量10加载到操作数栈中 image.png
- 2 istore_1:将操作数栈中栈顶数据存储到局部变量表下标为1的位置 image.png
- 3 iload_1:将局部变量表下标为1中的数据加载到操作数栈中 image.png
-
4 i2l:将int类型数据转换为long类型数据
- 5 lstore_2:将操作数栈中数据存储到局部变量表下标为2的位置 image.png
- 6 iload_1:将局部变量表下标为1中的数据加载到操作数栈中 image.png
-
7 i2f:将int类型数据转为float类型数据
- 8 fstore 4:将操作数栈中栈顶的float类型数据存储到局部变量表下标为4的位置 image.png
- 10 iload_1:将局部变量表下标为1中的数据加载到操作数栈中 image.png
-
11 i2d:将int类型数据转换为double类型数据
- 12 dstore 5:将操作数栈中栈顶的double类型数据存储到局部变量表下标为5的位置上 image.png
- 14 lload_2:将局部变量表下标为2中的long类型数据加载到操作数栈中 image.png
-
15 l2f:将long类型数据转换为float类型数据
- 16 fstore 7:将操作数栈中栈顶的float类型数据存储到局部变量表下标为7的位置 image.png
- 18 lload_2:将局部变量表下标为2中的long类型数据加载到操作数栈中 image.png
-
19 l2d:将long类型的数据转换为double类型数据
- 20 dstore 8:将操作数栈中栈顶的double类型数据存储到局部变量表下标为8的位置 image.png
- 22 fload 7:将局部变量表下标为7中的float类型数据加载到操作数栈中 image.png
-
24 f2d:将float类型数据转换为double类型数据
- 25 dstore 10:将操作数栈中栈顶的double类型数据存储到局部变量表下标为10的位置 image.png
3、窄化类型转换(Narrowing Numeric Conversion)
3.1、转换规则
- 从int类型 --> byte、short 或者 char 类型。对应的指令有:i2b、i2c、i2s
- 从long类型 --> int类型。对应的指令有:l2i
- 从float类型 --> long类型或者int类型。对应的指令有:f2l、f2i
- 从double类型 --> int、long 或者 float类型。对应的指令有:d2i、d2l、d2f
3.2、精度损失问题
- 窄化类型转换可能会导致转换结果具备不同的正负号、不同的数量级,因此,转换过程很可能会导致数值丢失精度。
- 尽管数据类型窄化转换可能会发生上限溢出、下限溢出和精度丢失等情况,但是Java虚拟机规范中明确规定数值类型的窄化转换指令永远不可能导致虚拟机抛出运行时异常
3.3、说明
-
3.3.1:当一个浮点值窄化转换为整数类型T(T限于int或long类型之一)的时候,将遵循以下转换规则
- 如果浮点值是NaN,那转换结果就是int或long类型的0
- 如果浮点值不是无穷大的话,浮点值使用IEEE 754 的向零舍入模式取整,获取整数值v,如果v在目标类型T(int或long)的表示范围之内,那转换结果就是v。否则,将根据v的符号,转换为T所能表示的最大或者最小正数
-
3.3.2:当将一个 double 类型窄化转换为 float 类型时,将遵循以下转换规则:通过向最接近数舍入模式舍入一个可以使用float类型表示的数字。最后结果根据下面这3条规则判断:
- 如果转换结果的绝对值太小而无法使用 float 来表示,将返回 float类型的正负0
- 如果转换结果的绝对值太大而无法使用 float来表示,将返回 float类型的正负无穷大
- 对于 double 类型的 NaN值将按规定转换为 float类型的 NaN值
3.4、实例
- 代码
/**
* 窄化类型转换
*/
public void downCast2() {
int i = 10;
byte b = (byte) i;
short s = (short) i;
char c = (char) i;
long l = 10L;
int i1 = (int) l;
byte b1 = (byte) l;
}
- 字节码
0 bipush 10
2 istore_1
3 iload_1
4 i2b
5 istore_2
6 iload_1
7 i2s
8 istore_3
9 iload_1
10 i2c
11 istore 4
13 ldc2_w #2 <10>
16 lstore 5
18 lload 5
20 l2i
21 istore 7
23 lload 5
25 l2i
26 i2b
27 istore 8
29 return
- 注意:在long类型转byte类型时,先从long类型转为int类型,再从int类型转为byte类型
3.5、精度问题
- code
public void downCast3() {
double d = Double.NaN;
int i = (int) d;
System.out.println(d);
System.out.println(i);
}
- 输出
NaN
0
3.5、无穷大窄化精度问题
- code
public void downCast4() {
double d = Double.POSITIVE_INFINITY;
long l = (long) d;
int i = (int) d;
System.out.println(d);
System.out.println(Double.MAX_VALUE);
System.out.println(l);
System.out.println(Long.MAX_VALUE);
System.out.println(i);
System.out.println(Integer.MAX_VALUE);
}
- 输出
Infinity
1.7976931348623157E308
9223372036854775807
9223372036854775807
2147483647
2147483647
六、对象的创建与访问指令
Java是面向对象的程序设计语言,虚拟机平台从字节码层面就对面向对象做了深层次的支持。有一系列指令专门用于对象操作,可进一步细分为创建指令、字段访问指令、数组操作指令、类型检查指令
1、创建指令
虽然类实例和数组都是对象,但Java虚拟机对类实例和数组的创建与操作使用了不同的字节码指令
1.1、创建类实例的指令:new
- 接收一个操作数,为指向常量池的索引,表示要创建的类型,执行完成后,将对象的引用压入栈
1.2、创建数组的指令
- newarray:创建基本类型数组
- anewarray:创建引用类型数组
- multianewarray:创建多维数组
1.3、实例
- code
public void newArray() {
int[] intArray = new int[10];
Object[] objectArray = new Object[10];
int[][] intMintArray = new int[10][10];
String[][] stringMintArray = new String[10][];
}
- 字节码
0 bipush 10
2 newarray 10 (int)
4 astore_1
5 bipush 10
7 anewarray #2 <java/lang/Object>
10 astore_2
11 bipush 10
13 bipush 10
15 multianewarray #3 <[[I> dim 2
19 astore_3
20 bipush 10
22 anewarray #4 <[Ljava/lang/String;>
25 astore 4
27 return
-
intArray 使用的是 newarray
-
objectArray 使用的是 anewarray
-
intMintArray 使用的是multianewarray
-
stringMintArray 使用的是anewarray,同样是二维数组为什么使用的不是multianewarray指令?
-
code
public void newArray() {
int[] intArray = new int[10];
Object[] objectArray = new Object[10];
int[][] intMintArray = new int[10][10];
String[][] stringMintArray = new String[10][10];
}
- 字节码
0 bipush 10
2 newarray 10 (int)
4 astore_1
5 bipush 10
7 anewarray #2 <java/lang/Object>
10 astore_2
11 bipush 10
13 bipush 10
15 multianewarray #3 <[[I> dim 2
19 astore_3
20 bipush 10
22 bipush 10
24 multianewarray #4 <[[Ljava/lang/String;> dim 2
28 astore 4
30 return
- 小结
- 只有明确了二维数组的数量后,才会使用multianewarray指令
2、字段访问指令
对象创建后,就可以通过对象访问指令获取对象实例或数组中的字段或者数组元素
- 访问类字段(static字段,或者称为类变量)的指令:getstatic、putstatic
- 访问类实例字段(非static字段,或者称为实例变量)的指令:getfield、putfield
实例
- code
public void setOrderId() {
Order order = new Order();
order.id = 1001;
System.out.println(order.id);
Order.name = "ORDER";
System.out.println(Order.name);
}
- 字节码
0 new #8 <com/lkty/loadandstore/Order>
3 dup
4 invokespecial #9 <com/lkty/loadandstore/Order.<init>>
7 astore_1
8 aload_1
9 sipush 1001
12 putfield #10 <com/lkty/loadandstore/Order.id>
15 getstatic #5 <java/lang/System.out>
18 aload_1
19 getfield #10 <com/lkty/loadandstore/Order.id>
22 invokevirtual #11 <java/io/PrintStream.println>
25 ldc #12 <ORDER>
27 putstatic #13 <com/lkty/loadandstore/Order.name>
30 getstatic #5 <java/lang/System.out>
33 getstatic #13 <com/lkty/loadandstore/Order.name>
36 invokevirtual #7 <java/io/PrintStream.println>
39 return
3、数组操作指令
3.1数组操作指令主要有:xastore和xaload指令
- 把一个数组元素加载到操作数栈的指令:baload、caload、saload、saload、iaload、laload、faload、daload、aaload
- 将一个操作数栈的值存储到数组元素中的指令:bastore、castore、sastore、lastore、fastore、dastore、aastore
-
取数组长度的指令:arraylength。该指令弹出栈顶的数组元素,获取数组的长度,将长度压入栈
image.png
3.2、说明
- 指令xaload:表示将数组的元素压栈,如saload、caload分别表示压入short数组和char数组。指令xaload在执行时,要求操作数中栈顶元素为数组索引i,栈顶顺序位第2个元素为数组引用a,该指令会弹出栈顶这两个元素,并将a[i]重新压入堆栈
- 指令xastore:表示将栈中数据存储到数组中,如iastore,它用于给一个int数组的给定索引赋值。在iastore执行前,操作数栈顶需要以此准备3个元素:值、索引、数组引用,iastore会弹出这3个值,并将值赋给数组中指定索引的位置
实例
- code
public void arrayTest() {
int[] intArray = new int[10];
intArray[1] = 10;
int indexValue = intArray[1];
}
- 字节码
0 bipush 10
2 newarray 10 (int)
4 astore_1
5 aload_1
6 iconst_1
7 bipush 10
9 iastore
10 aload_1
11 iconst_1
12 iaload
13 istore_2
14 return
4、类型检查指令
检查类实例或数组类型的指令:instanceof、checkcast
- checkcast指令用于检查类型前置转换是否可以进行。如果可以进行,那么checkcast指令不会改变操作数栈,否则它会抛出 ClassCastException 异常
- 指令 instanceof 用来判断给定对象是否是某一个类的实例,它会将判断结果压入操作数栈
七、方法调用与返回指令
1、方法调用指令
1.1、invokevirtual指令
- 用于调用对象的实例方法,根据对象的实际类型进行分派(虚方法分派),支持多态。这也是Java语言中“最常见的方法分派方式”
- 分派调用哪些“有可能实现重写的实例方法”
1.2、invokeInterface指令
- 用于调用“接口方法”,它会在运行时搜索由特定对象所实现的这个接口方法,并找出适合的方法进行调用
1.3、invokespecial指令
- 用于调用一些需要特殊处理的实例方法,如:实例初始化方法(构造器)、私有方法和父类方法。这些方法都是“静态类型绑定的”,不会在调用时进行动态派发
1.4、invokestatic指令
- 用于调用命名类中的类方法(static方法),这是“静态绑定”的
1.5、invokedynamic指令
- 调用“动态绑定”的方法,这个是JDK7后新加入的指令。用于在运行时动态解析出调用点限定符所引用的方法,并执行该方法。前面4条调用指令的分派逻辑都固化在 Java 虚拟机内部,而invokedynamic指令的分派逻辑是由用户所设定的引导方法决定的
2、方法返回指令
方法调用结束前,需要进行返回。方法返回指令是“根据返回值的类型区分”的
- ireturn(boolean、byte、char、short、int类型时使用)、lreturn、freturn、dreturn和areturn
- 还有一条return指令供声明为void的方法、实例初始化方法以及类和接口的类初始化使用
-
如果当前返回的是synchronized方法,那么还会执行一个隐含的monitorexit指令,退出临界区
image.png
八、操作数栈管理指令
如同操作一个普通数据结构中的堆栈那样,JVM提供的操作数栈管理指令,可以用于直接操作操作数栈的指令
1、操作数栈管理指令
- 将一个或两个元素从栈顶弹出,并且直接废弃:pop、pop2
- 复制栈顶一个或两个数值并将复制值或双份的复制值重新压入栈顶dup、dup2,dup_x1,dup2_x1,dup_x2,dup2_x2
- 将栈最顶端的两个Slot数值位置交换:swap。Java虚拟机没有提供交换两个64位数据类型(long、double)数值的指令
- 指令nop,是一个非常特殊的指令,它的字节码为0x00.和汇编语言中nop一样,它表示什么都不做。这条指令一般可用于调试、占位等
2、说明
2.1、不带_x的指令是复制栈顶数据并压入栈顶。包括两个指令,dup和dup2,dup的系数代表要复制的Slot个数
- dup开头的指令用于复制1个Slot的数据(1个int或1个reference类型数据)。
- dup2开头的指令用于复制2个Slot的数据(1个long或2个int或1个int+1个float类型数据)
2.2、带_x的指令是复制栈顶数据并插入栈顶一下的某个位置。共有4个指令,dup_x1,dup2_x1,dup_x2,dup2_x2。对于带_x的复制插入指令,只要将指令的dup和x的系数相加,结果即为需要插入的位置。
- dup_x1插入位置:1+1=2,即栈顶2个Slot下面
- dup_x2插入位置:1+2=3,即栈顶3个Slot下面
- dup2_x1插入位置:2+1=3,即栈顶3个Slot下面
- dup2_x2插入位置:2+2=4,即栈顶4个Slot下面
- pop:将栈顶的1个Slot数值出栈。如1个short类型数值
- pop2:将栈顶的2个Slot数值出栈。如1个double类型数值,或者2个int类型数值
九、控制转移指令
程序流程离不开条件控制,为了支持条件跳转,虚拟机提供了大量字节码指令,大体上可以分为:
1、比较指令
1.1、比较指令说明
- 比较指令的作用是比较栈顶两个元素的大小,并将比较结果入栈
- 比较指令有:dcmpg、dcmpl、fcmpg、fcmpl、lcmp
- 首字符d表示double类型,f表示float类型,l表示long类型
2、条件跳转指令
-
条件跳转指令有:ifeq、iflt、ifle、ifne、ifgt、ifge、ifnull、ifnonnull。这些指令都接收两个字节的操作数,用于计算跳转的位置
image.png - 对于boolean、byte、char、short类型的条件分支比较操作,都是使用int类型的比较指令完成
- 对于long、float、double类型的条件分支比较操作,则会先执行相应类型的比较运算指令,运算指令返回一个整型值到操作数栈中,随后再执行int类型的条件分支比较操作来完成整个分支跳转
- 由于各类型的比较最终都会转为int类型的比较操作,所以Java虚拟机提供的int类型的条件分支指令是最为丰富和强大的
3、比较条件跳转指令
- 比较条件跳转指令类似于比较指令和条件跳转指令的结合体,它将比较和跳转两个步骤合二为一
- 比较条件跳转指令有:if_icmpeq、if_icmpne、if_icmplt、if_icmpgt、if_icmple、if_icmpge、if_acmpeq和if_acmpne。 image.png
4、多条件分支跳转指令
- 多条件分支跳转指令是专为switch-case语句设计的,这样有tableswitch和lookupswitch image.png
- tableswitch:要求“多个条件分支值是连续的”,它内部只存放起始值和终止值,以及若干个跳转偏移量,通过给定的操作数index,可以立即定位到跳转偏移量位置,因此效率比较高
- 指令lookupswitch内部存放这各个离散的case-offset对,每次执行都要搜索全部的case-offset对,找到匹配的case值,并根据对应的offset计算跳转地址,因此效率较低。处于提升效率考虑,先使用hashcode值排序,然后在使用equal判断
5、无条件跳转指令
- 目前主要的无条件跳转指令为goto。goto指令接收两个字节的操作数,共同组成一个带符号的整数,用于指定指令的偏移量,指令执行的目的就是跳转到偏移量给定的位置处
- 指令偏移量太大,超过双字节的带符号整数的范围,则可以使用指令goto_w,它和goto有相同的作用,但是它接收4个字节的操作数,可以表示更大的地址范围 image.png
十、异常处理指令
1、抛出异常指令
1.1、athrow指令
- Java程序中显示抛出异常的操作(throw语句)都是有athrow指令来实现。除了使用throw语句显示抛出异常情况之外,“JVM规范还规定了许多运行时异常会在其他Java虚拟机指令检测到异常状况时自动抛出”。
- 整车情况下,操作数栈的压入弹出都是一条条指令完成的。唯一的例外情况是在抛异常时,Java虚拟机会清除操作数栈上的所有内容,而后将异常实例压入调用者曹锁数栈上
2、异常处理与异常表
2.1、处理异常
- 在Java虚拟机中,处理异常(catch语句)不是由字节码指令来实现的(早期使用jsr、ret指令),而是“采用异常表来完成的”
2.2、异常表
- 如果一个方法定义了一个try-catch或try-finally的异常处理,就会创建一个异常表。它包含了每个异常处理或者finally块的信息
- 起始位置
- 结束位置
- 程序计数器记录的代码处理的偏移地址
- 被捕获的异常类在常量池中的索引
- 当一个异常被抛出时,JVM会在当前的方法里寻找一个匹配的处理,如果没有找到,这个发给你法会强制结束并弹出当前栈帧,并且异常会重新给上层调用的方法(在调用方法栈帧)。如果在所有栈帧弹出前任然没有找到哦啊合适的异常处理,这个线程将终止。如果这个异常在最后一个非守护线程里抛出,将会导致JVM自己终止。比如这个线程是个main线程
-
不管什么时候抛出异常,如果异常处理最终匹配了所有一次类型,代码就会继续执行。在这种情况下,如果发给你法结束后没有抛出异常,仍然执行finally块,在return前,它直接跳到finally块来完成目标。
image.png
image.png
十一、同步控制指令
Java虚拟机支持两种同步结构:“方法级的同步”和“方法内部一段指令序列的同步”,这两种同步都是使用 monitor 来支持的
1、方法级的同步
- 方法级的同步是隐式的,即无需通过字节码指令来控制,它实现在方法调用和返回操作之中。虚拟机可以从方法常量池的方法表结构中的ACC_SYNCHRONIZED 访问标志得知一个方法是否声明为同步方法
- 当调用方法时,调用指令将会检查方法的ACC_SYNCHRONIZED访问标志是否设置
- 如果设置了,执行线程将先持有同步锁,然后执行方法。最后在方法完成(无论是正常完成还是非正常完成)时释放同步锁
- 在方法执行期间,执行线程持有了同步锁,其他任何线程都无法再获得同一个锁
- 如果一个同步方法执行期间抛出了异常,并且在方法内部无法处理此异常,那这个同步方法所持有的锁将在异常抛到同步方法之外时自动释放
2、方法内指定指令序列的同步
- 同步一段指令集序列:通常是由Java中的synchronized语句块来表示的。jvm的指令集有monitorenter和monitorexit两条指令来支持 synchronized 关键字的语义
- 当一个线程进入同步代码块时,它使用monitorenter指令请求进入。如果当前对象的监视器计数器为0,则它会被准许进入,若为1,则判断持有当前监视器的线程是否为自己,如果是,则进入,否则进行等待,知道对象的监视计数器为0,才会被允许进入同步块
- 当线程退出同步块时,需要使用monitorexit声明退出。在Java虚拟机中,任何对象都有一个监视器与之相关联,用来判断对象是否被锁定
- 指令monitorenter和monitorexit在执行时,都需要在操作数栈顶压入对象,之后monitorenter和monitorexit的锁定和释放都是针对这个对象的监视器进行的
- 只有当线程4离开临界区后,线程1、2、3才有可能进入 image.png
- 小结:
- 编译器必须确保无论方法通过何种方式完成,方法中调用过的每条monitorenter指令都必须执行其对应的monitorexit指令,而无论这个方法是正常结束还是异常结束
- 为了保证在方法移除完成时monitorenter和monitorexit指令依然可以正确配对执行,“编译器会自动产生一个异常处理器,这个异常处理器声明可处理所有的异常”,它的目的就是用来执行monitorexit指令