从JVM看Java语言特性(二) 构造器解析
1. 构造器解析
只要学过Java的人都知道, JVM在创建一个对象的时候会通过构造函数来决定这个类要如何构造, 构造函数在Java中是非常特殊的一类"方法", 通过这篇文章我们来探索一下构造器的底层实现.
还是以Tree.java为例, 分析一下Tree的字节码
public class Tree {
public static int state = 1;
int height;
public Tree(){
height = 0;
}
public Tree(int initialHeight){
height = initialHeight;
}
public static void message(String message){
return;
}
}
我定义了一个静态字段外加一个静态方法, 之后可以顺带分析一下带static标识的字段和方法是如何构造的. 现在先来看Tree的两个构造器:
public Dao.Tree();
descriptor: ()V
flags: (0x0001) ACC_PUBLIC
Code:
stack=2, locals=1, args_size=1
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: aload_0
5: iconst_0
6: putfield #2 // Field height:I
9: return
LineNumberTable:
line 8: 0
line 9: 4
line 10: 9
public Dao.Tree(int);
descriptor: (I)V
flags: (0x0001) ACC_PUBLIC
Code:
stack=2, locals=2, args_size=2
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: aload_0
5: iload_1
6: putfield #2 // Field height:I
9: return
LineNumberTable:
line 12: 0
line 13: 4
line 14: 9
从字节码中我们看出, 无论是怎么样的构造器, 在一开始都会调用<init>, 在之后才是构造器自己的逻辑. 事实上, 对于一个类的任何构造器, 编译器都会修改构造函数的字节码指令, 将Java类成员变量的初始化指令<init>插入到构造方法中, 那么这个<init>是什么呢? <<揭秘Java虚拟机>>的作者认为<init>就是无参构造器, 简直就是在胡说八道, 我们不妨试一下把无参构造去掉看看会是是怎么样的情况:
public class Tree {
public static int state = 1;
int height;
public Tree(int initialHeight){
height = initialHeight;
}
public static void message(String message){
return;
}
}
构造器的字节码为:
public Dao.Tree(int);
descriptor: (I)V
flags: (0x0001) ACC_PUBLIC
Code:
stack=2, locals=2, args_size=2
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: aload_0
5: iload_1
6: putfield #2 // Field height:I
9: return
LineNumberTable:
line 8: 0
line 9: 4
line 10: 9
非常明显的, 这个类里面没有无参构造器, 但是却有<init>, 这个结果非常轻易的就打了脸. 这样看来<init>和无参构造器没有什么关系, 那么<init>里面到底干了点啥呢? 实际上, 在<init>中, JVM主要完成Java类成员变量的初始化逻辑, 同时会执行Java类中被{}包裹的块逻辑. 如果成员变量没有被赋值, 那么不会被初始化, 也就不会放在<init>里面.
我们不妨举个例子, 对于下面这个类:
public class Tree {
int height = 3;
public Tree(){
}
public Tree(String message){
System.out.println(message);
}
}
它在JVM里面的表示应该就是:
public class Tree {
int height;
public Tree(){
height = 3;
}
public Tree(String message){
height = 3;
System.out.println(message);
}
}
这样就非常清楚了, <init>的作用就是把写在构造器外的字段赋值和{}块写到构造器里面, 让所有构造器有了共同的一段初始化, 减少了代码的重复性.
这里插几句, 关于构造器到底是个什么东西, <<Think in Java>>中认为构造器是一个静态方法的, 这个观点是非常有问题的. 首先, 在调用构造器的时候会将this引用传入, 字节码中对应的就是aload_0, 而静态方法因为是全局的, 是不可能传入this的, 这一点决定了他不可能是一个静态方法. 那么它有没有可能是一个私有的方法呢? 也不可能, 非常明显一点的是构造器本身是跟着这个类走的, 就连它是不是方法都不好说, 因为除了再new一个对象的时候会调用这个构造器, 其他时候是没有使用的(更正: 反射可以将构造器反射出来, 并且通过newInstance调用). 从这一点说的话构造器可以说是一种非常特殊的"方法".
2. 静态初始化解析
一旦理解了<init>的含义, <clinit>就会显得很简单, 因为它们俩的作用基本差不多, 只不过一个是普通成员的初始化, 一个静态初始化. 本文开头的Tree.java的静态相关的的字节码如下
public static void message(java.lang.String);
descriptor: (Ljava/lang/String;)V
flags: (0x0009) ACC_PUBLIC, ACC_STATIC
Code:
stack=0, locals=1, args_size=1
0: return
LineNumberTable:
line 17: 0
static {};
descriptor: ()V
flags: (0x0008) ACC_STATIC
Code:
stack=1, locals=0, args_size=0
0: iconst_1
1: putstatic #3 // Field state:I
4: return
LineNumberTable:
line 5: 0
这里的static {}就是<clinit>方法, 作用是完成了静态字段的赋值, 和执行static代码段. 我们列一张表来对比一下<init>和<clinit>的区别:
<init> | <clinit> | |
---|---|---|
初始化内容 | 普通成员变量赋值以及{}代码块 | 静态变量赋值以及static {}代码块 |
调用时机 | 对象构建时 | 类加载时(初始化) |
继承 | 可以继承 | 不能继承 |
可以看出, <clinit>不仅加载时间比<init>早很多, 并且在类加载时就会被调用. 关于<clinit>的调用时机, 一个最明显的例子就是注册JDBC Driver的时候只需要加一句
Class.forName("com.mysql.jdbc.Driver");
Driver就自己加载了, 这是为什么呢? 其实非常简单, com.mysql.jdbc.Driver这个类一共就一个构造方法再加一个下面的静态代码段, 在forName的时候这段代码就自动被加载进JVM, 完成了driver的注册:
static {
try {
DriverManager.registerDriver(new Driver());
} catch (SQLException var1) {
throw new RuntimeException("Can't register driver!");
}
}
挺有意思的吧?
3. 构造器的继承解析
在构造器的继承中, <init>和<clinit>这两者到底扮演着什么样的角色是我们所关心的, 简单来说<clinit>不具有继承性, 原因很简单, 父类和子类是分别加载的, 在父类加载时就已经执行过<clinit>方法, 就无需在子类再加载一遍, 所以子类只需要完成自己的<clinit>就行.
而对于<init>来说情况就比较复杂, 当Java类显示继承父类时, 则Java编译器会让子类的各个构造函数调用父类的默认构造函数<init>(). 从而在子类实例化是完成父类成员变量的初始化逻辑.
举个例子, 帮助你彻底理清新建对象时候的初始化问题:
public class Father {
{
System.out.println("father.{}");
}
static {
System.out.println("father.static{}");
}
public Father(){
System.out.println("father.constructor()");
}
}
public class Son extends Father{
{
System.out.println("Son.{}");
}
static {
System.out.println("Son.static{}");
}
public Son(){
System.out.println("Son.constructor");
}
public static void main(String[] args) {
Son son = new Son();
}
}
执行结果为:
father.static{}
Son.static{}
father.{}
father.constructor()
Son.{}
Son.constructor
从这个结果来看, 当新建一个对象时, 总是先加载父类再加载子类, 并且执行了他们的静态初始化过程, 也就是<clinit>, 接着再执行父类的默认无参构造函数(注意, 这里只能是无参构造器, 若父类没有无参构造器, 那么编译器会报错), 最后才是子类的构造函数.
从这个结果中我们还能看出, {}代码段是在构造器的输出之前执行的, 也间接证明了<init>被插入在了构造器的最前面.