序列化是将对象状态转换为可保持或传输的格式的过程。与序列化相对的是反序列化,它将流转换为对象。这两个过程结合起来,能够轻松地存储和传输数据。python
用来存取结构化数据。用于python特有的类型和python的数据类型间进行转换。json
①全部python支持的原生类型:布尔值,整数,浮点数,复数,字符串,字节,None;
②由任何原生类型组成的列表,元组,字典和集合;
③函数,类,类的实例。数据结构
pickle提供四个功能:dumps,dump,loads,load函数
函数的功能:将obj对象序列化为string形式,而不是存入文件中(以字节对象形式返回封装的对象,不须要写入文件中)。设计
参数讲解:code
obj:想要序列化的obj对象。orm
protocal:若是该项省略,则默认为0。若是为负值或HIGHEST_PROTOCOL,则使用最高的协议版本。对象
# dumps功能 # dumps 将数据经过特殊的形式转换为只有python语言认识的字符串 import pickle info = { 'name': 'Vivian', 'age': 20, 'height': 157 } data = pickle.dumps(info) # dumps会把数据变成bytes形式 print(data) # 输出 # b'\x80\x03}q\x00(X\x04\x00\x00\x00nameq\x01X\x06\x00\x00\x00Vivianq\x02X\x03\x00\x00\x00ageq\x03K\x14X\x06\x00\x00\x00heightq\x04K\x9du.'
函数的功能:将obj对象序列化存入已经打开的file中。内存
参数讲解:字符串
必填参数obj表示将要封装的对象
必填参数file表示obj要写入的文件对象,file必须以二进制可写模式打开,即“wb”
注:一个字典a = {'name':'Tom','age':22},用pickle.dump存到本地文件,所存数据的结构就是字典,而普通的file.write写入文件的是字符串。
# dump功能 # dump 将数据经过特殊的形式转换为只有python语言认识的字符串,并写入文件 import pickle info = { 'name': 'Vivian', 'age': 20, 'height': 157 } with open('information.pkl', 'wb') as f: pickle.dump(info, f)
函数的功能:反序列化。从string中读出序列化前的obj对象(从字节对象中读取被封装的对象,并返回)。
参数讲解:
string:文件名称。
# loads功能 # loads 将pickle数据转换为python的数据结构 import pickle info = { 'name': 'Vivian', 'age': 20, 'height': 157 } data1 = pickle.dumps(info) print(data1) data2 = pickle.loads(data1) print(data2) # 输出 # b'\x80\x03}q\x00(X\x04\x00\x00\x00nameq\x01X\x06\x00\x00\x00Vivianq\x02X\x03\x00\x00\x00ageq\x03K\x14X\x06\x00\x00\x00heightq\x04K\x9du.' # {'name': 'Vivian', 'age': 20, 'height': 157}
函数的功能:load对象反序列化,从文件读取数据,将file中的对象序列化读出。
参数讲解:
file:文件名称。必填参数file必须以二进制可读模式打开,即“rb”,其余都为可选参数。
# load功能 # load 从数据文件中读取数据,并转换为python的数据结构 import pickle with open('information.pkl', 'rb') as f: print(pickle.load(f)) # 输出 # {'name': 'Vivian', 'age': 20, 'height': 157}
用来存取结构化数据。用于字符串和Python数据类型间进行转换。
只能支持int\str\list\tuple\dict
json提供四个功能:dumps,dump,loads,load
文件里只能写字符串,但能够把字典转成json串,json串是字符串,能够存到文件里。
# json.dumps 将数据经过特殊的形式转换位全部程序语言都认识的字符串 import json info = { 'name': 'Vivian', 'age': 20, 'height': 157 } j_str = json.dumps(info) # 注意json dumps生成的是字符串,不是bytes print(j_str) print(type(j_str)) # 输出 # {"name": "Vivian", "age": 20, "height": 157} # <class 'str'>
# 使用.dump()方法前,要先打开文件,再写入 with open('massage.json', 'w') as f: json.dump(info, f)
# json.loads 用于解码 JSON 数据。该函数返回 Python 字段的数据类型 print(json.loads(j_str)) print(type(json.loads(j_str))) # 输出 # {'name': 'Vivian', 'age': 20, 'height': 157} # <class 'dict'>
with open('massage.json') as f: data = json.load(f) print(data) print(type(data)) # {"name": "Vivian", "age": 20, "height": 157} # <class 'dict'>
Json:
优势:跨语言(不一样语言间的数据传递可用json交接)、体积小
缺点:只能支持int\str\list\tuple\dict
Pickle:
优势:专为python设计,支持python全部的数据类型
缺点:只能在python中使用,存储数据占空间大
load和loads都是实现“反序列化”,区别在于:
即将Python内置数据序列化为字串。如使用json.dumps序列化的对象d_json=json.dumps({'a':1, 'b':2}),在这里d_json是一个字串'{"b": 2, "a": 1}'
d=json.loads(d_json) #{ b": 2, "a": 1},使用load从新反序列化为dict
如本地有一个json文件a.json则能够d=json.load(open('a.json'))
相应的,dump就是将内置类型序列化为json对象后写入文件