Python序列化与反序列化
序列化 (Serialization)将对象的状态信息转换为可以存储或传输的形式的过程。在序列化期间,对象将其当前状态写入到临时或持久性存储区。以后,可以通过从存储区中读取并反序列化对象的状态,重新创建该对象。
Pickle
pickle模块实现了对一个python对象序列化和反序列化的二进制协议。"picking"是一个过程,它将一个python对象层次结构转化为字节流,"unpickling"则是个相反的过程。
"Pickling"(和"unpickling")在其他语言中也被称为"serialization","marshalling" or "flattening"。为了防止混淆,在python中我们叫它"unpickling"和"unpickling"。
常用方法
pickle.dump(obj, file, protocol=None, *, fix_imports=True)
将一个对象序列化并写入打开的文件对象中。
注:文件对象必须是"wb"属性。
pickle.dumps(obj, protocol=None, *, fix_imports=True)
返回这个对象序列化的二进制形式,而不把它写到一个文件。
pickle.load(file, *, fix_imports=True, encoding="ASCII", errors="strict")
从文件中读取并返回被序列化的对象。
注:文件对象必须是"rb"属性。
pickle.loads(bytes_object, *, fix_imports=True, encoding="ASCII", errors="strict")
从字节流中读取并返回被序列化的对象。
Json
json同样最常用的是这四个方法。dumps(),dump()用于序列化,而loads(),load()用于反序列化。
区别于 pickle
- JSON是一个文本序列化格式(它输出unicode文本,虽然大部分时间它被编码为utf-8),但是pickle是一个二进制序列化格式
- JSON是人类可读的,然而pickle不是。
- JSON是在Python之外广泛应用的而且可以和别的语言相互使用的,而pickle是Python专属的。
- JSON默认情况下只能编译Python内置类型的子集,不能编译常规的class。pickle可以代表极其庞大的Python类型(其中许多是自动的,通过巧妙地使用Python的内省工具;复杂的案例可以通过实现特定的对象API来解决)。