你们好,今天想简单总结一下Python里一个很是棒的模快:Collectionsbash
该模块实现了专门的容器数据类型,为Python的通用内置容器提供了替代方案,若是对源码感兴趣的朋友们能够在 Lib/collections/init.py 路径下找到app
基于我目前的学习经验,如下几种类型用的不少:函数
名称 | 简单解释 |
---|---|
defaultdict | dict子类调用工厂函数来提供缺失值 |
counter | 用于计算可哈希对象的dict子类 |
deque | 相似于列表的容器,能够从两端操做 |
namedtuple | 用于建立具备命名字段的tuple子类的工厂函数 |
OrderedDict | 记录输入顺序的dict |
若是你和我同样也是小白,看到什么工厂函数,可哈希对象,容器这些词汇不要慌,我第一次看是懵逼并直接跳过的,然然后来发现根本不须要太理解,若是你们感兴趣能够本身去查询,我主要经过大量实例来一个个理解学习
基础概念ui
“defaultdict”是在名为“collections”的模块中定义的容器。它须要一个函数(默认工厂)做为其参数。默认状况下设置为“int”,即0.若是键不存在则为defaultdict,并返回且显示默认值。spa
我用人话解释一下: 其实就是一个查不到key值时不会报错的dictcode
应用实例对象
首先咱们来看一个用正常dict的例子,若是咱们建立了一个叫person的字典,里面存储的key值为name,age,若是这时候尝试调用person['city'],会抛出KeyError错误,由于没有city这个键值:教程
person = {'name':'xiaobai','age':18}
print ("The value of key 'name' is : ",person['name'])
print ("The value of key 'city' is : ",person['city'])
Out: The value of key 'name' is : xiaobai
Traceback (most recent call last):
File "C:\Users\E560\Desktop\test.py", line 17, in <module>
print ("The value of key 'city' is : ",person['city'])
KeyError: 'city'
复制代码
如今若是咱们用defaultdict再试试呢?索引
from collections import defaultdict
person = defaultdict(lambda : 'Key Not found') # 初始默认全部key对应的value均为‘Key Not Found’
person['name'] = 'xiaobai'
person['age'] = 18
print ("The value of key 'name' is : ",person['name'])
print ("The value of key 'adress' is : ",person['city'])
Out:The value of key 'name' is : xiaobai
The value of key 'adress' is : Key Not found
复制代码
此次没有问题了,其实最根本的缘由在于当咱们建立defaultdict时,首先传递的参数是全部key的默认value值,以后咱们添加name,age进去的时候才会有所改变,当咱们最终查询时,若是key存在,那就输出对应的value值,若是不存在,就会输出咱们事先规定好的值‘Key Not Found’
除此以外,由于咱们在建立defaultdict时,传参为全部key默认value值,所以利用这一特性,咱们还能够实现其余功能,好比:
from collections import defaultdict
d = defaultdict(list)
d['person'].append("xiaobai")
d['city'].append("paris")
d['person'].append("student")
for i in d.items():
print(i)
Out: ('person', ['xiaobai', 'student'])
('city', ['paris'])
复制代码
一个道理,咱们默认全部key对应的是一个list,天然就能够在赋值时使用list的append方法了。再好比下面这个例子:
from collections import defaultdict
food = (
('jack', 'milk'),
('Ann', 'fruits'),
('Arham', 'ham'),
('Ann', 'soda'),
('jack', 'dumplings'),
('Ahmed', 'fried chicken'),
)
favourite_food = defaultdict(list)
for n, f in food:
favourite_food[n].append(f)
print(favourite_food)
Out:defaultdict(<class 'list'>,
{'jack': ['milk', 'dumplings'],
'Ann': ['fruits', 'soda'],
'Arham': ['ham'],
'Ahmed': ['fried chicken']})
复制代码
道理和上面差很少,这里你们能够本身拓展,展开想象,相信可能在某个时刻必定能够用的上defaultdict
基础概念
Counter是dict的子类。所以,它是一个无序集合,其中元素及其各自的计数存储为字典。这至关于其余语言的bag或multiset。
个人理解就是一个计数器,返回一个字典,key就是出现的元素,value就是该元素出现的次数
应用实例
计数器没啥可说的,还能干啥,计数呗!
from collections import Counter
#计数list
count_list = Counter(['B','B','A','B','C','A','B','B','A','C'])
print (count_list)
#计数tuple
count_tuple = Counter((2,2,2,3,1,3,1,1,1))
print(count_tuple)
Out:Counter({'B': 5, 'A': 3, 'C': 2})
Counter({1: 4, 2: 3, 3: 2})
复制代码
Counter通常不会用于dict和Set的计数,由于dict的key是惟一的,而Set自己就不能有重复元素
如今咱们也能够直接把在defaultdict例子中用过food元组拿来计数:
from collections import Counter
food = (
('jack', 'milk'),
('Ann', 'fruits'),
('Arham', 'ham'),
('Ann', 'soda'),
('jack', 'dumplings'),
('Ahmed', 'fried chicken'),
)
favourite_food_count = Counter(n for n,f in food) #统计name出现的次数
print(favourite_food_count)
Out: Counter({'jack': 2, 'Ann': 2, 'Arham': 1, 'Ahmed': 1})
复制代码
基础概念
在咱们须要在容器两端的更快的添加和移除元素的状况下,可使用deque. 个人我的理解是deque就是一个能够两头操做的容器,相似list但比列表速度更快
应用实例
deque的方法有不少,不少操做和list相似,也支持切片
from collections import deque
d = deque()
d.append(1)
d.append(2)
d.append(3)
print(len(d))
print(d[0])
print(d[-1])
Out: 3
1
3
复制代码
deque最大的特色在于咱们能够从两端操做:
d = deque([i for i in range(5)])
print(len(d))
# Output: 5
d.popleft() # 删除并返回最左端的元素
# Output: 0
d.pop() # 删除并返回最右端的元素
# Output: 4
print(d)
# Output: deque([1, 2, 3])
d.append(100) # 从最右端添加元素
d.appendleft(-100) # 从最左端添加元素
print(d)
# Output: deque([-100, 1, 2, 3, 100])
复制代码
除了这些deque的方法实在太多了,好比我再举几个经常使用的例子,首先咱们定义一个deque时能够规定它的最大长度,deque和list同样也支持extend方法,方便列表拼接,可是deque提供双向操做:
from collections import deque
d = deque([1,2,3,4,5], maxlen=9) #设置总长度不变
d.extendleft([0]) # 从左端添加一个list
d.extend([6,7,8]) # 从右端拓展一个list
print(d)
Out:deque([0, 1, 2, 3, 4, 5, 6, 7, 8], maxlen=9)
复制代码
如今d已经有9个元素了,而咱们规定的maxlen=9,这个时候若是咱们从左边添加元素,会自动移除最右边的元素,反之也是同样:
d.append(100)
print(d)
d.appendleft(-100)
print(d)
Out: deque([1, 2, 3, 4, 5, 6, 7, 8, 100], maxlen=9)
deque([-100, 1, 2, 3, 4, 5, 6, 7, 8], maxlen=9)
复制代码
deque还有不少其余的用法,你们根据各自的须要去本身寻宝吧!
基础概念
名称元组。你们一看名字就会感受和tuple元组有关,没错,我认为它是元组的强化版 namedtuple能够将元组转换为方便的容器。使用namedtuple,咱们没必要使用整数索引来访问元组的成员。
我以为能够把namedtuple 视为 不可变的 字典
应用实例
首先,让咱们先回顾一下普通元组是如何访问成员的:
person = ('xiaobai', 18)
print(person[0])
Out:xiaobai
复制代码
如今咱们看看namedtuple(名称元组)的强大之处:
from collections import namedtuple
Person = namedtuple('Person', 'name age city') # 相似于定义class
xiaobai = Person(name="xiaobai", age=18, city="paris") # 相似于新建对象
print(xiaobai)
Out:Person(name='xiaobai', age=18, city='paris')
复制代码
咱们建立namedtuple时很是像定义一个class,这里Person比如是类名,第二个参数就是namedtuple的值的名字了,我感受很像class里的属性,不过这里不用加逗号分离,下面让咱们看看如何访问namedtuple的成员:
print(xiaobai.name)
print(xiaobai.age)
print(xiaobai.city)
out:xiaobai
18
paris
复制代码
"爽啊,爽死了",郭德纲看到这里不由赞叹
这种无限接近class调用属性的方式仍是很是不错的,在一些实际场景颇有用。 最后还有一点千万不要忘了,咱们不能修改namedtuple里的值:
xiaobai.name = 'laobai'
Out:Traceback (most recent call last):
File "C:\Users\E560\Desktop\test.py", line 5, in <module>
xiaobai.name = 'laobai'
AttributeError: can't set attribute 复制代码
基础概念
“OrderedDict” 自己就是一个dict,可是它的特别之处在于会记录插入dict的key和value的顺序
应用实例
from collections import OrderedDict
d = {}
d['a'] = 1
d['b'] = 2
d['c'] = 3
d['d'] = 4
print(d)
Out:{'a': 1, 'c': 3, 'b': 2, 'd': 4}
复制代码
你们能够看到,这是一个普通的dict,由于无序,即便咱们依次添加了a,b,c,d 四个键并赋予value,可是输出的顺序并不可控。OrderedDict的出现就是为了解决这个问题:
from collections import OrderedDict
d = OrderedDict()
d['a'] = 1
d['b'] = 2
d['c'] = 3
d['d'] = 4
print(d)
Out:OrderedDict([('a', 1), ('b', 2), ('c', 3), ('d', 4)])
复制代码
这回输出时好多了,由于会自动记录插入的顺序,同理,若是咱们删除一个key, OrderedDict的顺序不会发生变化:
from collections import OrderedDict
print("Before deleting:\n")
od = OrderedDict()
od['a'] = 1
od['b'] = 2
od['c'] = 3
od['d'] = 4
for key, value in od.items():
print(key, value)
print("\nAfter deleting:\n")
od.pop('c')
for key, value in od.items():
print(key, value)
print("\nAfter re-inserting:\n")
od['c'] = 3
for key, value in od.items():
print(key, value)
Out:Before deleting:
('a', 1)
('b', 2)
('c', 3)
('d', 4)
After deleting:
('a', 1)
('b', 2)
('d', 4)
After re-inserting:
('a', 1)
('b', 2)
('d', 4)
('c', 3)
复制代码
今天为你们简单介绍了collections的一些基础容器类型,包括:
容器类型 | 特色 |
---|---|
defaultdict | 找不到Key不会报错的dict |
counter | 计数器,key为出现的元素,value为该元素出现的次数 |
deque | 一个能够双向操做的list |
namedtuple | 用于建立具备命名字段的tuple |
OrderedDict | 记录key输入顺序的dict |
我以为把它们叫作宝藏感受仍是不过度的,由于这些容器在真实使用场景中很是有用,并且我发现不少教程不会提到,所以衷心但愿能够帮到你们,若是我哪里介绍有错误或者遗漏,但愿你们留言指出,让咱们一块儿进步!