Java序列化

2017-11-25 本文已影响12人德彪

什么是序列化

所谓的序列化，即把java对象以二进制形式保存到内存、文件或者进行网络传输。从二进制的形式恢复成为java对象，即反序列化。

通过序列化可以将对象持久化，或者从一个地方传输到另一个地方。这方面的应用有RMI，远程方法调用。

java中实现序列化有两种方式，实现Serializable接口或者Externalizable接口。这篇总结只讨论Serializable的情况。

public class SerializeTest implements Serializable{
        private static final long serialVersionUID = 1L;
        public String str;
        public SerializeTest(String str) {
               this.str = str;
        }
        
        public static void main(String[] args) throws IOException, ClassNotFoundException {
               SerializeTest test = new SerializeTest("hello");
               ByteArrayOutputStream oStream = new ByteArrayOutputStream();
               ObjectOutputStream objectOutputStream = new ObjectOutputStream(oStream);
               objectOutputStream.writeObject(test);//序列化
               
               ObjectInputStream inputStream = new ObjectInputStream(new ByteArrayInputStream(oStream.toByteArray()));
               SerializeTest obj = (SerializeTest) inputStream.readObject();//反序列化
               System.out.println(obj.str);
        }
}

上面的代码演示了类SerializeTest实现序列化和反序列化的过程。

所有的序列化和反序列化过程都是java默认实现的，你只需要实现接口Serializable，就能得到一个实现了序列化的类。
通过ObjectOutputStream和ObjectInputStream分别将序列化对象输出或者写入到某个流当中。流的目的地可以是内存字节数组(上例)、文件、或者网络。

下面研究一下序列化过程中的几个问题：

静态变量如何序列化

public class SeriaUtil {
        ByteArrayInputStream bInputStream;
        ByteArrayOutputStream byOutputStream;
        ObjectOutputStream outputStream ;
        ObjectInputStream inputStream;
        
        public void seria(Object test) throws IOException {
            if (byOutputStream == null) {
                byOutputStream = new ByteArrayOutputStream();
            }
            if (outputStream == null) {
                outputStream = new ObjectOutputStream(byOutputStream);
            }
            outputStream.writeObject(test);
//         System.out.println(byOutputStream.toByteArray().length); 
        }
        
        public Object  reSeria() throws IOException, ClassNotFoundException {
                if (bInputStream == null) {
                      bInputStream = new ByteArrayInputStream(byOutputStream.toByteArray());
                }
                if (inputStream == null) {
                    inputStream = new ObjectInputStream(bInputStream);
                }
                Object obj =  inputStream.readObject();
                return obj;
        }
}

public class StaticTest implements Serializable{
    private static final long serialVersionUID = 1L;
    public static int A = 0;
    public static String B = "hello";
    
    public static void main(String[] args) throws IOException, ClassNotFoundException {
            //先序列化类，此时 A=0 B = hello
            SeriaUtil seriaUtil = new SeriaUtil();
            StaticTest test = new StaticTest();
            seriaUtil.seria(test);
            //修改 静态变量的值
            StaticTest.A = 1;
            StaticTest.B = "world";
            
            StaticTest obj = (StaticTest) seriaUtil.reSeria();
            //输出 A = 1 B = world
            System.out.println(obj.A);
            System.out.println(obj.B);
    }
}

上面的代码说明了，静态变量不会被序列化。

序列化StaticTest实例test时，静态变量 A=0 B="hello"，序列化之后，修改StaticTest类的静态变量值，A=1 B="world"，
此时反序列化得到之前序列化的实例对象赋给obj，发现obj的静态变量变为A=1 B="world"，说明静态变量并未序列化成功。

事实上，在序列化对象时，会忽略对象中的静态变量。很好理解，静态变量是属于类的，而不是某个对象的状态。我们序列化面向的是对象，是想要将对象的状态保存下来，所以
静态变量不会被序列化。反序列化得到的对象中的静态变量的值是当前jvm中静态变量的值。静态变量对于同一个jvm中同一个类加载器加载的类来说，是一样的。对于同一个静态变量，不会存在同一个类的不同实例拥有不同的值。

同一对象序列化两次，反序列化后得到的两个对象是否相等

这个问题提到的相等，是指是否为同一对象，即==关系

在某些情况下，确保这种关系是很重要的。比如王经理和李经理拥有同一个办公室，即存在引用关系：

public class Manager{
    Room room;
    public Manager(Room r){
        room = r;
    }
}

public class Room{}

public class APP{
    public void main(String args[]){
        Room room = new Room();
        Manager wang = new Manager(room);
        Manager li = new Manager(room);
    }
}

反序列化之后，wang，li，room的这种引用关系不应该发生变化。通过代码验证一下：

public class ReferenceTest implements Serializable{
        public String a;
        public ReferenceTest() {
            a = "hah";
        }
        public static void main(String[] args) throws Exception {
              System.out.println("构造对象********************");
              ReferenceTest test = new ReferenceTest();
              System.out.println("序列化**********************");
              SeriaUtil util = new SeriaUtil();
              util.seria(test);
              util.seria(test);//第二次序列化该对象
              System.out.println("反序列化**********************");
              ReferenceTest obj = (ReferenceTest) util.reSeria();
              ReferenceTest obj1 = (ReferenceTest) util.reSeria();
              System.out.println(obj == obj1);//true
              System.out.println(obj == test);//false
        }
}

上面的例子证明（System.out.println(obj == obj1);//true），同一对象序列化多次之后，反序列化得到的多个对象相等，即内存地址一致。

使用同一个ObjectOutputStream对象序列化某个实例时，如果该实例还没有被序列化过，则序列化，若之前已经序列化过，则不再进行序列化，只是做一个标记而已。
所以在反序列化时，可以保持原有的引用关系。

System.out.println(obj == test);//false 也可以理解，反序列化之后重建了该对象，内存地址必然是新分配的，故obj != test

父类没有实现Serializable，父类中的变量如何序列化

public class SuperTest{
       public String superB;
       public SuperTest() {
           superB = "hehe";
           System.out.println("super 无参构造函数");
       }
       
       public SuperTest(String b){
           System.out.println("super 有参构造函数");
           superB = b;
       }
        public static void main(String[] args) throws IOException, ClassNotFoundException {
              System.out.println("构造对象*******************");
              SonTest sonTest = new SonTest("son", "super");
              System.out.println("序列化*********************");
              SeriaUtil  seriaUtil = new SeriaUtil();
              seriaUtil.seria(sonTest);
              System.out.println("反序列化******************");
              SonTest obj = (SonTest) seriaUtil.reSeria();
              System.out.println(obj.sonA);
              System.out.println(obj.superB);
        }
}

class SonTest extends SuperTest  implements Serializable{
     private static final long serialVersionUID = 1L;
     public String sonA;
     public SonTest() {
         System.out.println("son 无参构造函数");
     }
     
     public SonTest(String a, String b) {
         super(b);
         System.out.println("son 有参构造函数");
         sonA = a;
     }
}

输出：

构造对象*******************
super 有参构造函数
son 有参构造函数
序列化*********************
反序列化******************
super 无参构造函数
son
hehe

通过上面的代码可以看出，父类如果没有实现serializable，反序列化时会调用父类的无参构造函数初始化父类当中的变量。

所以，我们可以通过显示声明父类的无参构造函数，并在其中初始化变量值来控制反序列化后父类变量的值。

transient使用

实现了serializable接口的类在序列化时默认会将所有的非静态变量进行序列化。我们可以控制某些字段不被默认的序列化机制序列化。

比如，有些字段是跟当前系统环境相关的或者涉及到隐私的，需要保密的。这些字段是不可以被序列化到文件中或者通过网络传输的。我们可以通过为这些字段声明
transient关键字，保证其不被序列化。

被关键字transient声明的变量不会被序列化，反序列化时该变量会被自动填充为null（int 为0）。我们也可以为这些字段实现自己的序列化机制。

public class TransientTest implements Serializable{
       private static final long serialVersionUID = 1L;
        public transient String  str;
        public TransientTest() {
            str = "hello";
        }
        
        private void writeObject(ObjectOutputStream out) throws IOException {
            out.defaultWriteObject();
            String encryption = "key" + str;
            out.writeObject(encryption);
        }

        private void readObject(ObjectInputStream in) throws IOException, ClassNotFoundException {
            in.defaultReadObject();
           String encryption =  (String) in.readObject();
           str = encryption.substring("key".length(), encryption.length());
        }
        
        public static void main(String[] args) throws IOException, ClassNotFoundException {
              TransientTest test = new TransientTest();
              SeriaUtil util = new SeriaUtil();
              util.seria(test);
              TransientTest reSeria = (TransientTest) util.reSeria();
              System.out.println(reSeria.str);//hello
        }
}

通过实现writeObject和readObject实现自己的序列化机制。上面的代码模拟了一个加密的序列化过程。

成员变量没有实现序列化

序列化某个实例时，如果这个实例含有对象类型的成员变量，那么同时会触发该变量的序列化机制。这时就要求这个成员变量也实现Serializable接口，如果没有实现该接口，抛出异常。

public class VariableTest implements Serializable{
    Variable variable ;
    public VariableTest() {
        variable = new Variable();
    }
    public static void main(String[] args) throws IOException, ClassNotFoundException {
            System.out.println("构造对象*************");
            VariableTest variableTest = new VariableTest();
            System.out.println("序列化**************");
            SeriaUtil util = new SeriaUtil();
            //抛出异常：java.io.NotSerializableException
            util.seria(variableTest);
            System.out.println("反序列化****************");
            VariableTest obj = (VariableTest) util.reSeria();
            System.out.println(obj.variable.a);//抛出异常：Exception in thread "main" java.io.NotSerializableException: space.kyu.Variable
    }
}
class Variable {
    public String a;
    public Variable(){
        a = "hehe";
    }
}

单例模式下的序列化

public class SingleTest implements Serializable{
    public static SingleTest instance = new SingleTest();
    private SingleTest(){}
    public static void main(String[] args) throws IOException, ClassNotFoundException {
        SingleTest test = SingleTest.instance;
        SeriaUtil util = new SeriaUtil();
        util.seria(test);
        SingleTest reSeria = (SingleTest) util.reSeria();
        System.out.println(reSeria == SingleTest.instance);//false
    }
}

由上面的代码可以看出，有两个SingleTest实例同时存在，通过反序列化破坏了单例模式。反序列化时会开辟新的内存空间重新实例化对象，所以单例模式被破坏。

为了解决这种问题，可以实现readResolve()方法。

public class SingleTest implements Serializable{
    public static SingleTest instance = new SingleTest();
    private SingleTest(){}
    private Object readResolve() {
        return SingleTest.instance;
    }
    public static void main(String[] args) throws IOException, ClassNotFoundException {
        SingleTest test = SingleTest.instance;
        SeriaUtil util = new SeriaUtil();
        util.seria(test);
        SingleTest reSeria = (SingleTest) util.reSeria();
        System.out.println(reSeria == SingleTest.instance);//true
    }
}

序列化版本

代码是在不断的演化的。1.1版本的类可以读取1.0版本的序列化文件吗？这就涉及到序列化的版本管理。

每个序列化版本都有其唯一的ID，他是数据域类型和方法签名的指纹。当类的定义产生变化时，他的指纹也会跟着产生变化，对象流将拒绝读入具有不同指纹的对象。
如果想保持早期版本的兼容，首先要获取这个类早期版本的指纹。

我们可以使用 jdk自带的工具 serialver 获得这个指纹：serialver Test

staic final long serialVersionUID = -1423859403827594712L

然后将1.1版本中Test类的serialVersionUID常量定义为上面的值，即可序列化老版本的代码。

如果一个类具有名为serialVersionUID的常量，那么java就不会再主动计算这个值，而是直接将其作为这个版本类的指纹。没有特殊要求的话，一般都显示的声明serialVersionUID：private static final long serialVersionUID = 1L;来保证兼容性

如果对象流中的对象具有在当前版本中没有的数据域，那么对象流会忽略这些数据；如果当前版本具有对象流中所没有的数据域，那么这些新加的域将被设为默认值。

序列化与克隆

反序列化重新构建对象的机制提供了一种克隆对象的简便途径，只要对应的类可序列化即可。

做法很简单：直接将对象序列化到输出流当中，然后将其读回。这样产生的对象是对现有对象的一个深拷贝。

public class CloneTest implements Serializable, Cloneable {
    public String str;
    public CloneTest(String str) {
        this.str =str;
    }
    @Override
    protected Object clone() throws CloneNotSupportedException {
        SeriaUtil util = new SeriaUtil();
        try {
            util.seria(this);
            CloneTest reSeria = (CloneTest) util.reSeria();
            return reSeria;
        } catch (Exception e) {
            e.printStackTrace();
            return null;
        } 
        
    }
    public static void main(String[] args) throws CloneNotSupportedException {
        CloneTest test = new CloneTest("hi");
        CloneTest clone = (CloneTest) test.clone();
        System.out.println(clone.str);//hi
        System.out.println(clone == test);//false
    }
}

这样克隆对象的优点是简单，缺点是比普通的克隆实现要慢的多。