python集合(set)操做

  1 python的set和其余语言相似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算.  
  2   
  3 sets 支持 x in set, len(set),和 for x in set。做为一个无序的集合,sets不记录元素位置或者插入点。所以,sets不支持 indexing, slicing, 或其它类序列(sequence-like)的操做。  
  4   
  5    
  6   
  7 下面来点简单的小例子说明把。  
  8   
  9 >>> x = set('spam')  
 10 >>> y = set(['h','a','m'])  
 11 >>> x, y  
 12 (set(['a', 'p', 's', 'm']), set(['a', 'h', 'm']))  
 13   
 14 再来些小应用。  
 15   
 16 >>> x & y # 交集  
 17 set(['a', 'm'])  
 18   
 19 >>> x | y # 并集  
 20 set(['a', 'p', 's', 'h', 'm'])  
 21   
 22 >>> x - y # 差集  
 23 set(['p', 's'])  
 24   
 25 记得之前个网友提问怎么去除海量列表里重复元素,用hash来解决也行,只不过感受在性能上不是很高,用set解决仍是很不错的,示例以下:  
 26   
 27 >>> a = [11,22,33,44,11,22]  
 28 >>> b = set(a)  
 29 >>> b  
 30 set([33, 11, 44, 22])  
 31 >>> c = [i for i in b]  
 32 >>> c  
 33 [33, 11, 44, 22]  
 34   
 35 很酷把,几行就能够搞定。  
 36   
 37 1.8 集合   
 38    
 39 集合用于包含一组无序的对象。要建立集合,可以使用set()函数并像下面这样提供一系列的项:  
 40   
 41    
 42   
 43 s = set([3,5,9,10])      #建立一个数值集合  
 44   
 45 t = set("Hello")         #建立一个惟一字符的集合  
 46   
 47    
 48   
 49 与列表和元组不一样,集合是无序的,也没法经过数字进行索引。此外,集合中的元素不能重复。例如,若是检查前面代码中t集合的值,结果会是:  
 50   
 51    
 52   
 53 >>> t  
 54   
 55 set(['H', 'e', 'l', 'o'])  
 56   
 57    
 58   
 59 注意只出现了一个'l' 60   
 61 集合支持一系列标准操做,包括并集、交集、差集和对称差集,例如:  
 62   
 63    
 64   
 65 a = t | s          # t 和 s的并集  
 66   
 67 b = t & s          # t 和 s的交集  
 68   
 69 c = t – s          # 求差集(项在t中,但不在s中)  
 70   
 71 d = t ^ s          # 对称差集(项在t或s中,但不会同时出如今两者中)  
 72   
 73    
 74   
 75 基本操做:  
 76   
 77 t.add('x')            # 添加一项  
 78   
 79 s.update([10,37,42])  # 在s中添加多项  
 80   
 81    
 82   
 83 使用remove()能够删除一项:  
 84   
 85 t.remove('H')  
 86   
 87    
 88   
 89 len(s)  
 90 set 的长度  
 91   
 92 x in s  
 93 测试 x 是不是 s 的成员  
 94   
 95 x not in s  
 96 测试 x 是否不是 s 的成员  
 97   
 98 s.issubset(t)  
 99 s <= t  
100 测试是否 s 中的每个元素都在 t 中  
101   
102 s.issuperset(t)  
103 s >= t  
104 测试是否 t 中的每个元素都在 s 中  
105   
106 s.union(t)  
107 s | t  
108 返回一个新的 set 包含 s 和 t 中的每个元素  
109   
110 s.intersection(t)  
111 s & t  
112 返回一个新的 set 包含 s 和 t 中的公共元素  
113   
114 s.difference(t)  
115 s - t  
116 返回一个新的 set 包含 s 中有可是 t 中没有的元素  
117   
118 s.symmetric_difference(t)  
119 s ^ t  
120 返回一个新的 set 包含 s 和 t 中不重复的元素  
121   
122 s.copy()  
123 返回 set “s”的一个浅复制  
124   
125   
126 请注意:union(), intersection(), difference() 和 symmetric_difference() 的非运算符(non-operator,就是形如 s.union()这样的)版本将会接受任何 iterable 做为参数。相反,它们的运算符版本(operator based counterparts)要求参数必须是 sets。这样能够避免潜在的错误,如:为了更可读而使用 set('abc') & 'cbs' 来替代 set('abc').intersection('cbs')。从 2.3.1 版本中作的更改:之前全部参数都必须是 sets。  
127   
128 另外,Set 和 ImmutableSet 二者都支持 set 与 set 之间的比较。两个 sets 在也只有在这种状况下是相等的:每个 set 中的元素都是另外一个中的元素(两者互为subset)。一个 set 比另外一个 set 小,只有在第一个 set 是第二个 set 的 subset 时(是一个 subset,可是并不相等)。一个 set 比另外一个 set 打,只有在第一个 set 是第二个 set 的 superset 时(是一个 superset,可是并不相等)。  
129   
130 子 set 和相等比较并不产生完整的排序功能。例如:任意两个 sets 都不相等也不互为子 set,所以如下的运算都会返回 False:a<b, a==b, 或者a>b。所以,sets 不提供 __cmp__ 方法。  
131   
132 由于 sets 只定义了部分排序功能(subset 关系),list.sort() 方法的输出对于 sets 的列表没有定义。  
133   
134   
135 运算符  
136    运算结果  
137   
138 hash(s)  
139    返回 s 的 hash 值  
140   
141   
142 下面这个表列出了对于 Set 可用二对于 ImmutableSet 不可用的运算:  
143   
144 运算符(voperator)  
145 等价于  
146 运算结果  
147   
148 s.update(t)  
149 s |= t  
150 返回增长了 set “t”中元素后的 set “s”  
151   
152 s.intersection_update(t)  
153 s &= t  
154 返回只保留含有 set “t”中元素的 set “s”  
155   
156 s.difference_update(t)  
157 s -= t  
158 返回删除了 set “t”中含有的元素后的 set “s”  
159   
160 s.symmetric_difference_update(t)  
161 s ^= t  
162 返回含有 set “t”或者 set “s”中有而不是二者都有的元素的 set “s”  
163   
164 s.add(x)  
165   
166 向 set “s”中增长元素 x  
167   
168 s.remove(x)  
169   
170 从 set “s”中删除元素 x, 若是不存在则引起 KeyError  
171   
172 s.discard(x)  
173   
174 若是在 set “s”中存在元素 x, 则删除  
175   
176 s.pop()  
177   
178 删除而且返回 set “s”中的一个不肯定的元素, 若是为空则引起 KeyError  
179   
180 s.clear()  
181   
182 删除 set “s”中的全部元素  
183   
184   
185 请注意:非运算符版本的 update(), intersection_update(), difference_update()和symmetric_difference_update()将会接受任意 iterable 做为参数。从 2.3.1 版本作的更改:之前全部参数都必须是 sets。  
186   
187 还请注意:这个模块还包含一个 union_update() 方法,它是 update() 方法的一个别名。包含这个方法是为了向后兼容。程序员们应该多使用 update() 方法,由于这个方法也被内置的 set() 和 frozenset() 类型支持。  
相关文章
相关标签/搜索