Python3.7之pickle&json模块

时间 2020-01-17

标签 python3.7 python pickle&json pickle json 模块栏目 Python 繁體版

原文原文链接

Python3.7之pickle&json模块

1、什么叫序列化

序列化是将对象状态转换为可保持或传输的格式的过程。与序列化相对的是反序列化,它将流转换为对象。这两个过程结合起来,能够轻松地存储和传输数据。python

2、序列化pickle模块

pickle模块是作什么用的

用来存取结构化数据。用于python特有的类型和python的数据类型间进行转换。json

pickle能够存储的数据类型

①全部python支持的原生类型：布尔值，整数，浮点数，复数，字符串，字节，None；
②由任何原生类型组成的列表，元组，字典和集合；
③函数，类，类的实例。数据结构

pickle模块中经常使用的方法

pickle提供四个功能：dumps,dump,loads,load函数

①pickle.dumps(obj[, protocol])

函数的功能：将obj对象序列化为string形式，而不是存入文件中（以字节对象形式返回封装的对象，不须要写入文件中）。设计

参数讲解：code

obj：想要序列化的obj对象。orm

protocal：若是该项省略，则默认为0。若是为负值或HIGHEST_PROTOCOL，则使用最高的协议版本。对象

# dumps功能
# dumps 将数据经过特殊的形式转换为只有python语言认识的字符串
import pickle
info = {
    'name': 'Vivian',
    'age': 20,
    'height': 157
}

data = pickle.dumps(info)  # dumps会把数据变成bytes形式
print(data)

# 输出
# b'\x80\x03}q\x00(X\x04\x00\x00\x00nameq\x01X\x06\x00\x00\x00Vivianq\x02X\x03\x00\x00\x00ageq\x03K\x14X\x06\x00\x00\x00heightq\x04K\x9du.'

②pickle.dump(obj, file, protocol=None,)

函数的功能：将obj对象序列化存入已经打开的file中。内存

参数讲解：字符串

必填参数obj表示将要封装的对象

必填参数file表示obj要写入的文件对象，file必须以二进制可写模式打开，即“wb”

注：一个字典a = {'name':'Tom','age':22}，用pickle.dump存到本地文件，所存数据的结构就是字典，而普通的file.write写入文件的是字符串。

# dump功能
# dump 将数据经过特殊的形式转换为只有python语言认识的字符串，并写入文件
import pickle
info = {
    'name': 'Vivian',
    'age': 20,
    'height': 157
}

with open('information.pkl', 'wb') as f:
    pickle.dump(info, f)

③pickle.loads(string)

函数的功能：反序列化。从string中读出序列化前的obj对象（从字节对象中读取被封装的对象，并返回）。

参数讲解：

string：文件名称。

# loads功能
# loads  将pickle数据转换为python的数据结构
import pickle
info = {
    'name': 'Vivian',
    'age': 20,
    'height': 157
}

data1 = pickle.dumps(info)
print(data1)
data2 = pickle.loads(data1)
print(data2)

# 输出
# b'\x80\x03}q\x00(X\x04\x00\x00\x00nameq\x01X\x06\x00\x00\x00Vivianq\x02X\x03\x00\x00\x00ageq\x03K\x14X\x06\x00\x00\x00heightq\x04K\x9du.'
# {'name': 'Vivian', 'age': 20, 'height': 157}

④pickle.load(file)

函数的功能：load对象反序列化，从文件读取数据，将file中的对象序列化读出。

参数讲解：

file：文件名称。必填参数file必须以二进制可读模式打开，即“rb”，其余都为可选参数。

# load功能
# load 从数据文件中读取数据，并转换为python的数据结构
import pickle
with open('information.pkl', 'rb') as f:
    print(pickle.load(f))
    
# 输出
# {'name': 'Vivian', 'age': 20, 'height': 157}

3、序列化模块json

json模块是作什么用的

用来存取结构化数据。用于字符串和Python数据类型间进行转换。

json能够存储的数据类型

只能支持int\str\list\tuple\dict

json模块中经常使用的方法

json提供四个功能：dumps,dump,loads,load

①字典转成json串

文件里只能写字符串，但能够把字典转成json串，json串是字符串，能够存到文件里。

# json.dumps 将数据经过特殊的形式转换位全部程序语言都认识的字符串
import json
info = {
    'name': 'Vivian',
    'age': 20,
    'height': 157
}
j_str = json.dumps(info)  # 注意json dumps生成的是字符串，不是bytes
print(j_str)
print(type(j_str))

# 输出
# {"name": "Vivian", "age": 20, "height": 157}
# <class 'str'>

# 使用.dump()方法前，要先打开文件，再写入
with open('massage.json', 'w') as f:
    json.dump(info, f)

②json串转成字典

# json.loads 用于解码 JSON 数据。该函数返回 Python 字段的数据类型
print(json.loads(j_str))
print(type(json.loads(j_str)))

# 输出
# {'name': 'Vivian', 'age': 20, 'height': 157}
# <class 'dict'>

with open('massage.json') as f:
    data = json.load(f)
    print(data)
    print(type(data))

# {"name": "Vivian", "age": 20, "height": 157}
# <class 'dict'>

4、json vs pickle

Json:

优势：跨语言(不一样语言间的数据传递可用json交接)、体积小

缺点：只能支持int\str\list\tuple\dict

Pickle:

优势：专为python设计，支持python全部的数据类型

缺点：只能在python中使用，存储数据占空间大

5、load vs loads

load和loads都是实现“反序列化”，区别在于：

loads针对内存对象

即将Python内置数据序列化为字串。如使用json.dumps序列化的对象d_json=json.dumps({'a':1, 'b':2})，在这里d_json是一个字串'{"b": 2, "a": 1}'
d=json.loads(d_json) #{ b": 2, "a": 1}，使用load从新反序列化为dict

load针对文件句柄

如本地有一个json文件a.json则能够d=json.load(open('a.json'))

相应的，dump就是将内置类型序列化为json对象后写入文件