大数据,机器学习,人工智能

RPC通信的序列化方式选型

2020-05-05  本文已影响0人  Wayne维基

背景

上一篇已经介绍了定制了一个建议的RPC框架:简易RPC实现
之前的实现方式是Fastjson,但是为了进一步优化框架的性能。

几种常见的序列化方式

一些简单的比较

Serializable

优点: java原生,java工程中出镜率高
缺点:性能差,空间占用多,在网络通信中用得很少,需要指定serialVersionUID

xml,json,fastjson

优点:可读性好,fastjson在速度上有优势,json格式在建站,特别是对于性能要求不是很高的场景应用很广泛。
缺点:xml,json性能和空间占用上都没有优势,fastjson在国内用得很多,但是文档不全,时间类的序列化有bug,国际上口碑一般。

avro

优点:Avro 是 Hadoop 的一个子项目,Avro提供两种序列化格式:JSON格式或者Binary格式。Binary格式在空间开销和解析性能方面可以和Protobuf媲美,动态语言友好,Avro提供的机制使动态语言可以方便地处理Avro数据。avro是基于schema(模式),这和protobuf、thrift没什么区别

protobuf

优点:跨语言,可自定义数据结构。二进制消息,效率高,性能高。Netty等框架集成了该协议。序列化后码流小,性能高。提供结构化数据存储格式(XML JSON等)
缺点:二进制格式,可读性差(抓包dump后的数据很难看懂)
适用场景:

选型建议

受到这个文章的启发:
https://www.cnblogs.com/wkcode/p/10431096.html

耗时 空间占用

分析上图知:

不同的场景适用的序列化协议:

Protobuf实现

结合以上信息,项目对于性能要求较高,决定使用Protobuf作为序列化协议。

Objenesis的使用

Java已经支持使用class.newinstance()的类动态实例化,但是必须要有一个合适的构造函数。而很多场景下类不能够用这种方式去实例化,例如:

构造函数需要参数(Constructors that require arguments)
有副作用的构造函数(Constructors that have side effects)
会抛出异常的构造函数(Constructors that throw exceptions)

Objenesis objenesis = new ObjenesisStd(); // or ObjenesisSerializer
MyThingy thingy1 = (MyThingy) objenesis.newInstance(MyThingy.class);

// or (a little bit more efficient if you need to create many objects)

Objenesis objenesis = new ObjenesisStd(); // or ObjenesisSerializer
ObjectInstantiator thingyInstantiator = objenesis.getInstantiatorOf(MyThingy.class);

MyThingy thingy2 = (MyThingy)thingyInstantiator.newInstance();
MyThingy thingy3 = (MyThingy)thingyInstantiator.newInstance();
MyThingy thingy4 = (MyThingy)thingyInstantiator.newInstance();

核心代码

    public static <T> String serializer(T obj) {
        Class<T> cls = (Class<T>) obj.getClass();
        LinkedBuffer buffer = LinkedBuffer.allocate(LinkedBuffer.DEFAULT_BUFFER_SIZE);
        try {
            Schema<T> schema = getSchema(cls);
            return new String(ProtostuffIOUtil.toByteArray(obj, schema, buffer));
        } catch (Exception e) {
            log.error("protobuf序列化失败");
            throw new IllegalStateException(e.getMessage(), e);
        } finally {
            buffer.clear();
        }
    }

    public static <T> T deserializer(byte[] bytes, Class<T> clazz) {
        try {
            T message = (T) objenesis.newInstance(clazz);
            Schema<T> schema = getSchema(clazz);
            ProtostuffIOUtil.mergeFrom(bytes, message, schema);
            return message;
        } catch (Exception e) {
            log.error("protobuf反序列化失败");
            throw new IllegalStateException(e.getMessage(), e);
        }
    }

实验结果比较

测试对象:

@Data
public class TestObject {

    String a = "123";
    String a1 = "a1";
    String a2 = "a2";
    Integer b = 10;
    Double c = 2.5;

    List<String> d = Arrays.asList(new String[]{"1", "2"});
    Map<String, String> e = new HashMap<String, String>(){
            {
                    put("ak", "av");
            }
    };

    Object f = null;
}

分别用fastjson和protobuf,序列化/反序列化 1000次:

fastjson si result:{"a":"123","a1":"a1","a2":"a2","b":10,"c":2.5,"d":["1","2"],"e":{"ak":"av"}}
fastjson desi result:TestObject(a=123, a1=a1, a2=a2, b=10, c=2.5, d=[1, 2], e={ak=av}, f=null)
fastjson cost:362
fastjson size:76

protebuf si result:
�123��a1��a2 
)�@2�12�2;�
�ak��av<
protebuf desi result:TestObject(a=123, a1=a1, a2=a2, b=10, c=2.5, d=[1, 2], e={ak=av}, f=null)
protebuf cost:275
protebuf size:42

可以看到,

上一篇下一篇

猜你喜欢

热点阅读