Python中的迭代

时间 2020-06-20

标签 python 迭代栏目 Python 繁體版

原文原文链接

　　在Python中迭代序列（或者其余可迭代对象）时，有一些函数很是好用。有些函数位于itertools模块中，还有一些Python的内建函数也十分方便。python

　　1. 并行迭代

　　程序能够同时迭代两个序列。好比有下面两个列表：函数

names = ['anne', 'beth', 'george', 'damon'] ages = [12, 45, 32, 102]

　　若是想要打印名字和对应的年龄，能够像下面这样作：spa

In [7]: for i in range(len(names)): ...: print(names[i], 'is', ages[i], 'years old') ...: anne is 12 years old beth is 45 years old george is 32 years old damon is 102 years old

　　这里 i 是循环索引的标准变量名。code

　　而内建的zip函数就能够用来进行并行迭代，能够把两个序列 “压缩” 在一块儿，而后返回一个元组的列表：对象

>>> zip(names, ages)
[('anne', 12), ('beth', 45), ('george', 32), ('damon', 102)]

　　如今我能够在循环中解包元组：blog

In [9]: for name, age in zip(names, ages): ...: print(name, 'is', age, 'years old') ...: anne is 12 years old beth is 45 years old george is 32 years old damon is 102 years old

　　zip 函数也能够做用于任意多的序列。关于它很重要的一点是zip能够处理不等长的序列，当最短的序列 “用完” 的时候就会中止：排序

>>> zip(range(5), xrange(1000000000))
[(0, 0), (1, 1), (2, 2), (3, 3), (4, 4)]

　　在上面的代码中，不推荐用range替换xrange——尽管只须要要前5个数字，但range会计算全部的数字，这里要花费很长的时间。而使用xrange就没有这个问题，它只计算前5个数字。索引

　　2. 按索引迭代

　　有些时间想要迭代访问序列中的对象，同时还有获取当前对象的索引。例如，在一个字符串列表中替换全部包含'xxx'的子字符串。实现的方法确定有不少，假设你想象下面这样作：ip

for string in strings: if 'xxx' in string: index = strings.index(string)  # Search for the string in the list of strings
        strings[index] = '[censored]'

　　没问题，可是在替换前要搜索给定的字符串彷佛不必。若是不替换的话，搜索还会返回错误的索引（前面出现的同一个词的索引）。一个比较好的版本以下：内存

index = 0 for string in strings: if 'xxx' in string: strings[index] = '[censored]' index += 1

　　方法有些笨，不过还能够接受。另外一种方法是使用内建的enumerate函数：

for index, string in enumerate(strings): if 'xxx' in string: strings[index] = '[censored]'

　　这个函数能够在提供索引的地方迭代索引-值对

　　3. 翻转和排序迭代

　　让咱们看看另外两个有用的函数：reversed和sorted。它们同列表的reverse和sort（sorted和sort使用一样的参数）方法相似，但做用于任何序列或可迭代对象上，不是原地修改对象，而是返回翻转或排序后的版本：

>>> sorted([4, 3, 6, 8, 3]) [3, 3, 4, 6, 8] >>> sorted('Hello, world!') [' ', '!', ',', 'H', 'd', 'e', 'l', 'l', 'l', 'o', 'o', 'r', 'w'] >>> list(reversed('Hello, world!')) ['!', 'd', 'l', 'r', 'o', 'w', ' ', ',', 'o', 'l', 'l', 'e', 'H'] >>> ''.join(reversed('Hello, world!')) '!dlrow ,olleH'

　　注意，虽然sorted方法返回列表，reversed方法却返回一个更加难以想象的可迭代对象。它们具体的含义不用过多关注，大可在for循环以及join方法中使用，而不会有任何问题。不过却不能直接对它使用索引、分片以及调用list方法，若是但愿进行上述处理，那么可使用list类型转换返回的对象，上面的例子中已经给出具体的作法。

　　4. 迭代器规则

　　迭代的意思是重复作一些事不少次，就像在循环中作的那样。到如今为止只在for循环中对序列和字典进行过迭代，但实际上也能对其余对象进行迭代：只要改对象实现了__iter__方法。

　　__iter__方法会返回一个迭代器（iterator），所谓的迭代器就是具备next方法（这个方法在调用时不须要任何参数）的对象。在调用next方法时，迭代器会返回它的下一个值。若是next方法被调用，但迭代器没有值能够返回，就会引起一个StopIteration异常。

注意　　迭代器规则在Python 3.0中有一些变化。在新的规则中，迭代器对象应该实现__next__方法，而不是next。而新的内建函数next能够用于访问这个方法。换句话说，next(it)等同于3.0以前版本中的it.next()。

　　迭代规则的关键是什么？为何不使用列表？由于列表的杀伤力太大。若是一个函数，能够一个接一个地计算值，那么在使用时多是计算一个值时获取一个值——而不是经过列表一次性获取全部值。若是有不少值，列表就会占用太多的内存。但还有其余的理由：使用迭代器更通用、更简单、更优雅。让咱们看看一个不使用列表的例子，由于要用的话，列表的长度必须无限。

　　这里的“列表”是一个斐波那契数列。使用的迭代器以下：

In [1]: class Fibs: ...: def __init__(self): ...: self.a = 0 ...: self.b = 1 ...: def next(self): ...: self.a, self.b = self.b, self.a + self.b ...: return self.a ...: def __iter__(self): ...: return self

　　注意，迭代器实现了__iter__方法，这个方法实际上返回迭代器自己。在不少状况下，__iter__会放到其余的会在for循环中使用的对象中。这样一来，程序就能返回所需的迭代器。此外，推荐使用迭代器实现它本身的__iter__方法，而后就能直接在for循环中使用迭代器自己了。

注意　　正式的说法是，一个实现了__iter__方法的对象是可迭代的，一个实现了next方法的对象则是迭代器。

　　首先，产生一个Fibs对象：

In [2]: fibs = Fibs()

　　可在for循环中使用该对象——好比去查找在斐波那契数列中比1000大的数中的最小的数：

In [3]: for f in fibs: ...: if f > 1000: ...: print f ...: break

1597

　　由于设置了break，因此循环在这里中止了，不然循环会一直继续下去。

提示　内建函数iter能够从可迭代的对象中得到迭代器。

>>> it = iter([1, 2, 3]) >>> it.next() 1
>>> it.next() 2

　　除此以外，它也能够从函数或者其余可调用对象中获取可迭代对象。

　　5. 从迭代器获得序列

　　除了在迭代器和可迭代对象上进行迭代外，还能把它们转换为序列。在大部分能使用序列的状况下（除了或者分片等操做中），都能使用迭代器（或者可迭代对象）替换。关于这个的一个颇有用的例子是使用list构造方法显示地将迭代器转化为列表。

>>> class TestIterator: ... value = 0 ... def next(self): ... self.value += 1 ... if self.value > 10: ... raise StopIteration ... return self.value ... def __iter__(self): ... return self ... >>> ti = TestIterator() >>> list(ti) [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]