Java 串行化

2017-10-30  本文已影响0人  wangdy12

Serialization 是把对象的状态转换为字节流,同时字节流也可以转换为对象,反向过程叫做 Deserialization

串行化可以把对象的状态保存到文件中,也可以通过网络传输对象

串行化接口

java.io.Serializable接口是一个标记接口(不含有数据和方法),String和所有的原始数据类型的包装器类都默认实现了该接口

ObjectOutputStream类用来串行化对象为OutputStream,类字段如果是引用,对应的引用对象也需要序列化
ObjectInputStream 类用来反序列化先前串行化的原始数据和对象,重构对象

可以写入多个对象或原始数据类型到输出流,这些对象必须从相应的ObjectInputstream读取,类型和顺序应该要和写入的相同

FileOutputStream fos = new FileOutputStream("t.tmp");
ObjectOutputStream oos = new ObjectOutputStream(fos);

oos.writeInt(12345);
oos.writeObject("Today");
oos.writeObject(new Date());

oos.close();
FileInputStream fis = new FileInputStream("t.tmp");
ObjectInputStream ois = new ObjectInputStream(fis);

int i = ois.readInt();
String today = (String) ois.readObject();
Date date = (Date) ois.readObject();

ois.close();

如果需要特殊处理序列化和反序列化,可以在类中自定义序列化方法

 private void writeObject(java.io.ObjectOutputStream out)
     throws IOException
 private void readObject(java.io.ObjectInputStream in)
     throws IOException, ClassNotFoundException;
 private void readObjectNoData()
     throws ObjectStreamException;

为了避免因为,JAVA的序列化机制采用了一种特殊的算法:

1、所有保存到磁盘中的对象都有一个序列化编号
2、当程序试图序列化一个对象时,会先检查该对象是否已经被序列化过,只有该对象从未(在本次虚拟机中)被序列化,系统才会将该对象转换成字节序列并输出
3、如果对象已经被序列化,程序将直接输出一个序列化编号,而不是重新序列化

serialVersionUID

用来确保在反序列化的过程中,加载的是同样的类(序列号对应的类)

语法:

ANY-ACCESS-MODIFIER static final long serialVersionUID = 1L;

原因:
有可能序列化一个对象到文件中,几个月后才在不同的JVM进行反序列化,此时对应的类可能已经改变了。
如果要反序列化的serialVersionUID不相同,产生异常InvalidClassException

生成方式:

Externalizable

Serializable接口的子类,通过特定的两个方法来指定要序列化的对象,而父类直接序列化所有对象

writeExternal(ObjectOutput out)
readExternal(ObjectInput in)

与父类Serializable的区别,反序列化重构对象时,先通过一个public的无参数构造函数创建对象,再调用readExternal方法,父类是直接通过ObjectInputStream创建的


测试

import java.io.*;

public class Solution {
    public static void main(String[] args) throws IOException {
        ObjectOutputStream outputStream = new ObjectOutputStream(new FileOutputStream("/home/wdy/Desktop/test"));
        outputStream.writeObject(new Test(0xBBBBBBBB,"Wang"));
        outputStream.close();
    }

    public static class Test implements Serializable {
        public static final long serialVersionUID = 0xAAAAAAAAAAAAAAAAL;
        int num;
        String name;

        public Test(int num, String name) {
            this.num = num;
            this.name = name;
        }
    }
}

写出的二进制数据:

  Offset: 00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F   
00000000: AC ED 00 05 73 72 00 21 63 6F 6D 2E 67 69 74 68    ,m..sr.!com.gith
00000010: 75 62 2E 77 61 6E 67 64 79 31 32 2E 53 6F 6C 75    ub.wangdy12.Solu
00000020: 74 69 6F 6E 24 54 65 73 74 AA AA AA AA AA AA AA    tion$Test*******
00000030: AA 02 00 02 49 00 03 6E 75 6D 4C 00 04 6E 61 6D    *...I..numL..nam
00000040: 65 74 00 12 4C 6A 61 76 61 2F 6C 61 6E 67 2F 53    et..Ljava/lang/S
00000050: 74 72 69 6E 67 3B 78 70 BB BB BB BB 74 00 04 57    tring;xp;;;;t..W
00000060: 61 6E 67                                           ang


解释:

序列化会记录每个类的名称,字段的名称和类型,最后才是具体的数据类型

ObjectOutputStream初始化时就会写出头信息:

写一个普通的对象writeOrdinaryObject

类描述信息writeClassDesc

写出具体的数据writeSerialData

序列化使用的常量位于ObjectStreamConstants类中,内部包含一些标志位

static final short STREAM_MAGIC = (short)0xaced;
static final short STREAM_VERSION = 5;
static final byte TC_NULL =         (byte)0x70;
static final byte TC_CLASSDESC =    (byte)0x72;
static final byte TC_OBJECT =       (byte)0x73;
static final byte TC_STRING =       (byte)0x74;
static final byte TC_ENDBLOCKDATA = (byte)0x78;

Kryo

一种更高效的的序列化方式,相同对象的序列化,大小大大减小

public class Solution {
    public static void main(String[] args) throws IOException {
        Kryo kryo = new Kryo();
        kryo.register(Test.class);//需要进行注册,不注册时改为 kryo.setRegistrationRequired(false);
        Test test = new Test(0xBBBBBBBB,"Wang");
        Output output = new Output(new FileOutputStream("/home/wdy/Desktop/test-kryo"));
        kryo.writeClassAndObject(output, test);
        output.close();

        Input input = new Input(new FileInputStream("/home/wdy/Desktop/test-kryo"));
        Object object2 = kryo.readClassAndObject(input);
        input.close();
        System.out.println(((Test)object2).num);
    }
}

注册后序列化结果只有10个字节,不包含类型信息,第一个字节是一个变长int,表示注册对应的序号,之后四个字节表示Wang,且g最后一个字节的最高位为1,即最后一个字节为负数,表示字符串结束,最后五个字节是一个边长编码的int,即0xBBBBBBBB

  Offset: 00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F   
00000000: 0B 57 61 6E E7 89 91 A2 C4 08                      .Wang.."D.

如果不进行注册,对应结果会记录类名称

  Offset: 00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F   
00000000: 01 00 63 6F 6D 2E 67 69 74 68 75 62 2E 77 61 6E    ..com.github.wan
00000010: 67 64 79 31 32 2E 53 6F 6C 75 74 69 6F 6E 24 54    gdy12.Solution$T
00000020: 65 73 F4 57 61 6E E7 89 91 A2 C4 08                estWang.."D.

上一篇下一篇

猜你喜欢

热点阅读