你们好,恰逢初五迎财神,先预祝你们新年财源滚滚!!
在上一期详解tuple元组的用法后,今天咱们来看Python里面最后一种常见的数据类型:集合(Set)shell
与dict相似,set也是一组key的集合,但不存储value。因为key不能重复,因此,在set中,没有重复的key。建立一个set,须要提供一个list做为输入集集合,重复元素在set中会被自动被过滤,经过add(key)方法往set中添加元素,重复添加不会有效果。若是如今你发现我讲的很模糊请不要着急。稍后会有海量例子为你们详解。函数
总而言之,Set具备三个显著特色:测试
如今让咱们开启Set奇幻之旅,我但愿这篇文章是SegmentFault社区对于Set介绍最全的模范,哈哈!spa
咱们有两种方式能够建立一个Set,可使用内置的set()方法,或是使用中括号{}
建立模板以下:3d
x = set(<iter>) x = {<obj>, <obj>, ..., <obj>}
如今让咱们来看例子~code
set()内置方法建立
x = set(['foo', 'bar', 'baz', 'foo', 'qux']) # 传入List print(x) y = set(('foo', 'bar', 'baz', 'foo', 'qux')) #传入元组 print(y) Out: {'qux', 'foo', 'bar', 'baz'} # 注意到无序了吧~ {'bar', 'qux', 'baz', 'foo'}
这里要注意用set()内置方法建立时必定要传递一个能够迭代的参数,还有从输出结果相信你们已经发现set的第一个特色了:无序对象
字符串也是可迭代的,所以字符串也能够传递给set()blog
s = 'quux' a = set(s) print(a) Out: {'u', 'q', 'x'} # 无序,惟一
这里又体现了set的第二个特色:元素惟一性索引
{} 方法建立
>>> x = {'foo', 'bar', 'baz', 'foo', 'qux'} >>> x {'qux', 'foo', 'bar', 'baz'}
这里考虑到以后例子太多,实在不能每次都打print啦,这种形式你们看的更清楚,这个直接用{}建立很简单,只要传递进元素就行啦ip
建立空集合
Set能够是空的。可是,请记住Python将空花括号{}解释为空字典,所以定义空集的惟一方法是使用set()函数
>>> x = set() >>> type(x) <class 'set'> >>> x = {} >>> type(x) <class 'dict'>
一个空集合用布尔类型显示为False
>>> x = set() >>> bool(x) False >>> x or 1 1 >>> x and 1 set()
对比小结
对于这两种方法建立Set,本质区别在于如下两点
补充说明
集合中的元素能够是不一样类型的对象,不必定非要是同一类型的,能够包含不一样类型,好比:
>>> x = {42, 'foo', 3.14159, None} >>> x {None, 'foo', 42, 3.14159}
但同时不要忘记set元素必须是不可变的。例如,元组能够包括在集合中:
>>> x = {42, 'foo', (1, 2, 3), 3.14159} >>> x {42, 'foo', 3.14159, (1, 2, 3)}
但列表和字典是可变的,所以它们不能成为Set的元素:
>>> a = [1, 2, 3] >>> {a} Traceback (most recent call last): File "<pyshell#70>", line 1, in <module> {a} TypeError: unhashable type: 'list' >>> d = {'a': 1, 'b': 2} >>> {d} Traceback (most recent call last): File "<pyshell#72>", line 1, in <module> {d} TypeError: unhashable type: 'dict'
len()函数返回集合中元素的数量,而in和not in运算符可用于测试是否为Set中的元素:
>>> x = {'foo', 'bar', 'baz'} >>> len(x) 3 >>> 'bar' in x True >>> 'qux' in x False
方法和运算符
许多可用于Python其余数据类型的操做对集合没有意义。例如,没法对集合创建索引或切片。可是,Python在set对象上提供了运算符,这些操做符其实不少和数学里是如出一辙的,相信数学好的朋友们对这部分简直不要太熟悉
因此对于Set的操做除了用普通的内置方法,咱们也可使用运算符,比较方便
Union 并集
让咱们新建两个Set作测试:
>>> x1 = {'foo', 'bar', 'baz'} >>> x2 = {'baz', 'qux', 'quux'}
如今咱们想求x1,x2的并集,以下图所示:
具体实现方法以下,或是用方法,或是用操做符:
>>> x1 = {'foo', 'bar', 'baz'} >>> x2 = {'baz', 'qux', 'quux'} >>> x1.union(x2) {'foo', 'qux', 'quux', 'baz', 'bar'} >>> x1 | x2 {'foo', 'qux', 'quux', 'baz', 'bar'}
若是有两个以上的Set也是没有问题的,原理都是同样的:
>>> a = {1, 2, 3, 4} >>> b = {2, 3, 4, 5} >>> c = {3, 4, 5, 6} >>> d = {4, 5, 6, 7} >>> a.union(b, c, d) {1, 2, 3, 4, 5, 6, 7} >>> a | b | c | d {1, 2, 3, 4, 5, 6, 7}
Intersection 交集
如今还让咱们用刚才建立好的两个set,所求部分以下图:
实现仍然是两种方法: >>> x1 = {'foo', 'bar', 'baz'} >>> x2 = {'baz', 'qux', 'quux'} >>> x1.intersection(x2) {'baz'} >>> x1 & x2 {'baz'}
多个集合的状况公示和方法依然有效,结果仅包含全部指定集合中都存在的元素。
>>> a = {1, 2, 3, 4} >>> b = {2, 3, 4, 5} >>> c = {3, 4, 5, 6} >>> d = {4, 5, 6, 7} >>> a.intersection(b, c, d) {4} >>> a & b & c & d {4}
Difference 差集
下图所示为x1.difference(x2)的目标结果:
>>> x1 = {'foo', 'bar', 'baz'} >>> x2 = {'baz', 'qux', 'quux'} >>> x1.difference(x2) {'foo', 'bar'} >>> x1 - x2 {'foo', 'bar'}
仍是老样子,适用于2个及以上的集合:
>>> a = {1, 2, 3, 30, 300} >>> b = {10, 20, 30, 40} >>> c = {100, 200, 300, 400} >>> a.difference(b, c) {1, 2, 3} >>> a - b - c {1, 2, 3}
指定多个集合时,操做从左到右执行。在上面的示例中,首先计算a - b,获得{1,2,3,300}。而后从该集合中减去c,留下{1,2,3},具体流程以下图所示:
Symmetric Difference 对称差集
下图所示为x1.symmetric_difference(x2)的目标结果:
实现方法以下;
>>> x1 = {'foo', 'bar', 'baz'} >>> x2 = {'baz', 'qux', 'quux'} >>> x1.symmetric_difference(x2) {'foo', 'qux', 'quux', 'bar'} >>> x1 ^ x2 {'foo', 'qux', 'quux', 'bar'}
老规矩,支持2个及以上set的连续操做:
>>> a = {1, 2, 3, 4, 5} >>> b = {10, 2, 3, 4, 50} >>> c = {1, 50, 100} >>> a ^ b ^ c {100, 5, 10}
当指定多个集合时,操做从左到右执行,奇怪的是,虽然 ^ 运算符容许多个集合,但.symmetric_difference()方法不容许
>>> a = {1, 2, 3, 4, 5} >>> b = {10, 2, 3, 4, 50} >>> c = {1, 50, 100} >>> a.symmetric_difference(b, c) Traceback (most recent call last): File "<pyshell#11>", line 1, in <module> a.symmetric_difference(b, c) TypeError: symmetric_difference() takes exactly one argument (2 given)
x1.isdisjoint(x2) 判断是否相交
>>> x1 = {'foo', 'bar', 'baz'} >>> x2 = {'baz', 'qux', 'quux'} >>> x1.isdisjoint(x2) False >>> x2 - {'baz'} {'quux', 'qux'} >>> x1.isdisjoint(x2 - {'baz'}) True
从这个栗子能够看出,若是两个Set没有共同元素返回True,若是有返回True,若是返回True同时也意味着
他们之间的交集为空集,这个很好理解:
>>> x1 = {1, 3, 5} >>> x2 = {2, 4, 6} >>> x1.isdisjoint(x2) True >>> x1 & x2 set()
注意:目前尚未运算符对应这个方法
x1.issubset(x2) 判断x1是否为x2子集
>>> x1 = {'foo', 'bar', 'baz'} >>> x1.issubset({'foo', 'bar', 'baz', 'qux', 'quux'}) True >>> x2 = {'baz', 'qux', 'quux'} >>> x1 <= x2 False
一个集合自己固然是它本身的子集啦:
>>> x = {1, 2, 3, 4, 5} >>> x.issubset(x) True >>> x <= x True
x1<x2 判断x1是否为x2的真子集
首先。。。让咱们回顾一下数学知识:真子集与子集相似,除了集合不能相同。若是x1的每一个元素都在x2中,而且x1和x2不相等,则集合x1被认为是另外一个集合x2的真子集
换个高大上的说法也能够:若是集合A⊆B,存在元素x∈B,且元素x不属于集合A,咱们称集合A与集合B有真包含关系,集合A是集合B的真子集(proper subset)。记做A⊊B(或B⊋A),读做“A真包含于B”(或“B真包含A”)
>>> x1 = {'foo', 'bar'} >>> x2 = {'foo', 'bar', 'baz'} >>> x1 < x2 True >>> x1 = {'foo', 'bar', 'baz'} >>> x2 = {'foo', 'bar', 'baz'} >>> x1 < x2 False
虽然Set被认为是其自身的子集,但它自己并非本身的真子集:
>>> x = {1, 2, 3, 4, 5} >>> x <= x True >>> x < x False
注意:目前尚未方法对应这个运算符
x1.issuperset(x2) 判断x1是否为x2的超集
>>> x1 = {'foo', 'bar', 'baz'} >>> x1.issuperset({'foo', 'bar'}) True >>> x2 = {'baz', 'qux', 'quux'} >>> x1 >= x2 False
咱们刚才已经看到过了一个Set是它本身自己的子集,这里也是同样的,它同时也是本身的超集
>>> x = {1, 2, 3, 4, 5} >>> x.issuperset(x) True >>> x >= x True
x1 > x2 判断x1是否为x2的真超集
真超集与超集相同,除了集合不能相同。若是x1包含x2的每一个元素,而且x1和x2不相等,则集合x1被认为是另外一个集合x2的真超集。
>>> x1 = {'foo', 'bar', 'baz'} >>> x2 = {'foo', 'bar'} >>> x1 > x2 True >>> x1 = {'foo', 'bar', 'baz'} >>> x2 = {'foo', 'bar', 'baz'} >>> x1 > x2 False
一个集合不是它本身的真超集,和真子集的原理相同
>>> x = {1, 2, 3, 4, 5} >>> x > x False
虽然集合中包含的元素必须是不可变类型,但能够修改集合自己。与上面的操做相似,可使用多种运算符和方法来更改集合的内容。
x1.update(x2) 经过union修改集合元素
x1.update(x2) 和 x1 |= x2 做用是向集合x1中添加x2中全部x1不存在的元素。
停下3秒,我仔细读了这句话,以为我表达的还能够,不知道你们读上去绕不绕,先看例子:
>>> x1 = {'foo', 'bar', 'baz'} >>> x2 = {'foo', 'baz', 'qux'} >>> x1 |= x2 >>> x1 {'qux', 'foo', 'bar', 'baz'} >>> x1.update(['corge', 'garply']) >>> x1 {'qux', 'corge', 'garply', 'foo', 'bar', 'baz'}
x1.intersection(x2) 经过intersection修改集合元素
x1.intersection_update(x2) 和 x1 &= x2 会让x1只保留x1和x2的交集部分:
>>> x1 = {'foo', 'bar', 'baz'} >>> x2 = {'foo', 'baz', 'qux'} >>> x1 &= x2 >>> x1 {'foo', 'baz'} >>> x1.intersection_update(['baz', 'qux']) >>> x1 {'baz'}
x1.difference_update(x2) 经过difference修改集合元素
x1.difference_update(x2) and x1 -= x2 会让集合x1移除全部在x2出现的属于x1的元素:
>>> x1 = {'foo', 'bar', 'baz'} >>> x2 = {'foo', 'baz', 'qux'} >>> x1 -= x2 >>> x1 {'bar'} >>> x1.difference_update(['foo', 'bar', 'qux']) >>> x1 set()
x1.symmetric_difference_update(x2) 经过对称差集修改集合元素
这个我实在用语言解释不清了,看例子容易懂:
>>> x1 = {'foo', 'bar', 'baz'} >>> x2 = {'foo', 'baz', 'qux'} >>> >>> x1 ^= x2 >>> x1 {'bar', 'qux'} >>> >>> x1.symmetric_difference_update(['qux', 'corge']) >>> x1 {'bar', 'corge'}
x.add(<elem> 添加元素
这个就很简单了, 相似List:
>>> x = {'foo', 'bar', 'baz'} >>> x.add('qux') >>> x {'bar', 'baz', 'foo', 'qux'}
x.remove(<elem>) 删除元素
若是删除的元素不存在会抛出异常
>>> x = {'foo', 'bar', 'baz'} >>> x.remove('baz') >>> x {'bar', 'foo'} >>> x.remove('qux') Traceback (most recent call last): File "<pyshell#58>", line 1, in <module> x.remove('qux') KeyError: 'qux'
这个时候为了不出现错误能够用discard方法
>>> x = {'foo', 'bar', 'baz'} >>> x.discard('baz') >>> x {'bar', 'foo'} >>> x.discard('qux') >>> x {'bar', 'foo'}
利用pop删除随机元素并返回:
>>> x = {'foo', 'bar', 'baz'} >>> x.pop() 'bar' >>> x {'baz', 'foo'} >>> x.pop() 'baz' >>> x {'foo'} >>> x.pop() 'foo' >>> x set()
利用clear能够清空一个集合:
>>> x = {'foo', 'bar', 'baz'} >>> x {'foo', 'bar', 'baz'} >>> >>> x.clear() >>> x set()
Frozen Sets是什么东西
Python提供了另外一种称为冻结集合Frozen Sets的内置类型,它在全部方面都与集合彻底相同,只不过Frozen Sets是不可变的。咱们能够对冻结集执行非修改操做,好比:
>>> x = frozenset(['foo', 'bar', 'baz']) >>> x frozenset({'foo', 'baz', 'bar'}) >>> len(x) 3 >>> x & {'baz', 'qux', 'quux'} frozenset({'baz'})
若是胆敢尝试修改Frozen Sets:
>>> x = frozenset(['foo', 'bar', 'baz']) >>> x.add('qux') Traceback (most recent call last): File "<pyshell#127>", line 1, in <module> x.add('qux') AttributeError: 'frozenset' object has no attribute 'add' >>> x.pop() Traceback (most recent call last): File "<pyshell#129>", line 1, in <module> x.pop() AttributeError: 'frozenset' object has no attribute 'pop' >>> x.clear() Traceback (most recent call last): File "<pyshell#131>", line 1, in <module> x.clear() AttributeError: 'frozenset' object has no attribute 'clear' >>> x frozenset({'foo', 'bar', 'baz'})
基本使用举例
Frozensets在咱们想要使用集合的状况下颇有用,但须要一个不可变对象。
例如,若是没有Frozen sets咱们不能定义其元素也是集合的集合(nested),由于集合元素必须是不可变的,会报错:
>>> x1 = set(['foo']) >>> x2 = set(['bar']) >>> x3 = set(['baz']) >>> x = {x1, x2, x3} Traceback (most recent call last): File "<pyshell#38>", line 1, in <module> x = {x1, x2, x3} TypeError: unhashable type: 'set'
如今有了 Frozen sets,咱们有了解决方案:
>>> x1 = frozenset(['foo']) >>> x2 = frozenset(['bar']) >>> x3 = frozenset(['baz']) >>> x = {x1, x2, x3} >>> x {frozenset({'bar'}), frozenset({'baz'}), frozenset({'foo'})}
这一期为你们讲了太多东西,一口老血吐在键盘上,总结不动了
只但愿这期Set详解介绍能够帮助到你们,若是帮到了你,就点个赞吧~~
最后再次祝你们猪年大吉!!