1、目录python
一、集合概述shell
二、关于集合的操做符、关系符号函数
三、集合的一系列操做(添加、更新、访问、删除)spa
四、关于集合的内建函数、内建方法code
五、小结对象
2、集合概述索引
集合(set):把不一样的元素组成一块儿造成集合,是python基本的数据类型。element
集合元素(set elements):组成集合的成员rem
1 >>> li=['a','b','c','a']2 >>> se =set(li)3 >>> se4 set(['a', 'c', 'b'])
集合对象是一组无序排列的可哈希的值:集合成员能够作字典的键字符串
>>> li=[['a','b','c'],['a','c']]>>> se = set(li)Traceback (most recent call last): File "<pyshell#29>", line 1, in <module> se = set(li) TypeError: list objects are unhashable
集合分类:可变集合、不可变集合
可变集合(set):可添加和删除元素,非可哈希的,不能用做字典的键,也不能作其余集合的元素
不可变集合(frozenset):与上面偏偏相反
集合操做符与关系符号:(忘完了!)
3、集合的相关操做
一、建立集合
因为集合没有本身的语法格式,只能经过集合的工厂方法set()和frozenset()建立
>>> s = set('beginman')>>> s set(['a', 'b', 'e', 'g', 'i', 'm', 'n'])>>> t = frozenset('pythonman')>>> t frozenset(['a', 'h', 'm', 'o', 'n', 'p', 't', 'y'])>>> type(s),type(t) (<type 'set'>, <type 'frozenset'>)>>> len(s),len(t) (7, 8)>>> s==t False>>> s=t>>> s==t True>>>
二、访问集合
因为集合自己是无序的,因此不能为集合建立索引或切片操做,只能循环遍历或使用in、not in来访问或判断集合元素。
>>> 'a' in s True>>> 'z' in s False>>> for i in s: print i a h m o n p t y>>>
三、更新集合
可以使用如下内建方法来更新:
s.add()
s.update()
s.remove()
注意只有可变集合才能更新:
>>> s.add(0)Traceback (most recent call last): File "<pyshell#46>", line 1, in <module> s.add(0)AttributeError: 'frozenset' object has no attribute 'add'>>> type(s)<type 'frozenset'> >>> se = set(s)>>> se set(['a', 'h', 'm', 'o', 'n', 'p', 't', 'y'])>>> type(se)<type 'set'> >>> se.add(0)>>> se set(['a', 0, 'h', 'm', 'o', 'n', 'p', 't', 'y'])>>> se.update('MM')>>> se set(['a', 0, 'h', 'm', 'o', 'n', 'p', 'M', 't', 'y'])>>> se.update('Django')>>> se set(['a', 0, 'D', 'g', 'h', 'j', 'm', 'o', 'n', 'p', 'M', 't', 'y'])>>> se.remove('D')>>> se set(['a', 0, 'g', 'h', 'j', 'm', 'o', 'n', 'p', 'M', 't', 'y'])>>>
del:删除集合自己
4、集合类型操做符
一、in ,not in
二、集合等价与不等价(==, !=)
三、子集、超集(见上表)
>>> set('shop')<set('cheeshop') True>>> set('bookshop')>=set('shop') True
四、联合(|)
联合(union)操做与集合的OR操做其实等价的,联合符号有个等价的方法,union()。
>>> s1=set('begin')>>> s2=set('man')>>> s3=s1|s2>>> s3 set(['a', 'b', 'e', 'g', 'i', 'm', 'n'])
>>> s1.union(s2) set(['a', 'b', 'e', 'g', 'i', 'm', 'n'])
但+ 运算则不适合:
>>> s3New = s1+s2Traceback (most recent call last): File "<pyshell#68>", line 1, in <module> s3New = s1+s2 TypeError: unsupported operand type(s) for +: 'set' and 'set'
五、交集(&)
与集合AND等价,交集符号的等价方法是intersection()
>>> s1&s2 set(['n'])>>> s1.intersection(s2) set(['n'])
六、查补(-)
等价方法是difference()
>>> s1-s2 set(['i', 'b', 'e', 'g'])>>> s1.difference(s2) set(['i', 'b', 'e', 'g'])
七、对称差分(^)
对称差分是集合的XOR(‘异或’),取得的元素属于s1,s2但不一样时属于s1和s2.其等价方法symmetric_difference()
>>> s1^s2 set(['a', 'b', 'e', 'g', 'i', 'm'])>>> s1.symmetric_difference(s2) set(['a', 'b', 'e', 'g', 'i', 'm'])
注意:集合之间and,or
>>> s1 and s2 set(['a', 'm', 'n']) #取 s2>>> s1 or s2 set(['i', 'b', 'e', 'g', 'n']) #取 s1>>>
5、集合、列表、元组、字符串之间转换
>>> list(s1) ['i', 'b', 'e', 'g', 'n']>>> str(s1)"set(['i', 'b', 'e', 'g', 'n'])">>> tuple(s1) ('i', 'b', 'e', 'g', 'n')
应用:
'''最简单的去重方式'''lis = [1,2,3,4,1,2,3,4]print list(set(lis)) #[1, 2, 3, 4]
6、关于集合的内建函数、内建方法
一、len():返回集合元素个数
二、set()、frozenset()工厂函数
三、全部集合方法:
四、仅适合可变集合