python迭代和解析(3):range、map、zip、filter和reduce函数

解析、迭代和生成系列文章:http://www.javashuo.com/article/p-aspbesnv-du.htmlhtml


range

range()是一个内置函数,它返回一个数字序列,功能和Linux下的seq命令差很少。python

>>> list(range(10))
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

>>> list(range(5,10))
[5, 6, 7, 8, 9]

>>> list(range(1,10,2))
[1, 3, 5, 7, 9]

range()返回的是一个可迭代对象(迭代器),能够被迭代工具for/in/map/zip等操做。git

>>> 1 in range(10)
True

>>> for i in range(10):print(i,end=" ")
...
0 1 2 3 4 5 6 7 8 9

>>> R = range(4)
>>> I = iter(R)
>>> next(I)
0
>>> I.__next__()
1
>>> next(I)
2
>>> next(I)
3
>>> next(I)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

做为一个可迭代对象,它还支持len()操做和索引操做:函数

>>> R = range(5)
>>> len(R)
5
>>> R[2]
2

若是想要实现其它功能,能够将其转换为list/tuple/set,而后使用这些类型的功能。工具

总归要记住,迭代器是惰性的,不会一次性生成全部数据,而是按需一个一个收集起来的。编码

正如上面的range(),它不会一次性将全部数字序列都生成出来再返回,而是生成一个返回一个,须要的时候再生成一个返回一个,这可以节约内存空间。code

map

map不管在Perl仍是在Python中都是很是强大的工具,Python中map的做用是对给定列表/元组/集合中的每一个元素都应用一个函数操做。htm

好比,对一系列的数值全都乘2:对象

>>> def time2(x):return 2*x
>>> M = map(time2, [1,2,3,4,5])
>>> M
<map object at 0x000001AFDC2C57B8>
>>> list(M)
[2, 4, 6, 8, 10]

再好比将字符串中的字符全都转换成大写,此次直接将map的结构所有收集到一个列表中:blog

>>> list( map(str.upper,"abcd") )
['A', 'B', 'C', 'D']

map支持多个元素集合,它会每次从这些元素集合中并行取出一个元素做为函数的参数:

>>> list( map(pow, [1,2,3], [2,3,4]) )
[1, 8, 81]

第一次取出1和2做为pow的参数,因此计算的是pow(1,2)获得1;第二次取出2和3做为pow的参数,因此计算的是pow(2,3)获得8,第三次取出的是3和4,因此计算的是pow(3,4)获得81。

对于map,有几个注意点:

  1. map能够有多个参数,从第二个参数开始是元素集合,这些元素集合能够是任意可迭代对象,好比内置容器类型、range等
  2. map的第一个参数是想要对每一个元素进行操做的函数,能够是已定义的函数,也能够是lambda。它是map的回调函数
    • 若是是已定义的函数,则只需传递函数名称
    • 若是是lambda,则须要指定正确数量的参数
  3. map自身返回的就是迭代器,也就是说它本身是本身的迭代器
  4. map是迭代操做,因此它的工做方式是惰性的,按需一次返回一个数据,而不是收集完全部数据后一次性返回
  5. 全部map操做都能替换成等价的for循环,但map的效率比for要高的多,基本能和解析操做的效率差很少

由于map返回的是自身的迭代器,因此能够被for/map/zip/in等迭代工具操做,例如手动迭代:

>>> 2 in map(time2,[1,2,3,4,5])
True

>>> M = map(str.upper,"abcd")
>>> M
<map object at 0x000001AFDC2C5748>
>>> next(M)
'A'
>>> next(M)
'B'
>>> next(M)
'C'
>>> next(M)
'D'
>>> next(M)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

例如,使用lambda做为map的第一个回调函数的参数:

>>> M = map(lambda x: x * 2, [2,3,4,5])
>>> list(M)
[4, 6, 8, 10]

因为map操做的是迭代器中的每一个元素,因此map通常均可以写成等价的列表解析操做。

>>> [ x * 2 for x in [1,2,3,4,5] ]
[2, 4, 6, 8, 10]

>>> list( map(lambda x: x * 2, [1,2,3,4,5]) )
[2, 4, 6, 8, 10]

通常来讲,若是map中使用了lambda,则map效率要稍低于列表解析,若是没有使用lambda,则map效率要稍高于列表解析。虽然它们效率差很少,可是若是能够的话,强烈建议使用列表解析,由于列表解析是python中极简洁、极可读的编码方式

zip

zip()函数能够从一个或多个可迭代对象中并行取出元素进行并行的迭代。它也是返回自身的迭代器。

例如:

>>> L1 = ["one","two","three"]
>>> L2 = [1,2,3]

>>> zip(L1,L2)
<zip object at 0x000001AFDC2D9A08>
>>> list(zip(L1,L2))
[('one', 1), ('two', 2), ('three', 3)]

之因此能并行迭代多个可迭代对象,是由于它同时标记多个可迭代对象的迭代位置。若是zip的多个可迭代对象的长度不一样,则以最短的长度为标准,由于zip最多只能标记到最短长度的迭代位置。

由于zip返回的是迭代器,因此可使用迭代工具去操做zip的结果:

>>> L1 = ["one","two","three"]
>>> L2 = [1,2,3]

>>> ("one",1) in zip(L1,L2)
True

>>> for (x,y) in zip(L1,L2):print(x,"-->",y)
...
one --> 1
two --> 2
three --> 3

zip经常使用于构建dict,由于它并行从多个迭代对象中取数据:

>>> L1 = ["one","two","three"]
>>> L2 = [1,2,3]

>>> dict(zip(L1,L2))
{'one': 1, 'two': 2, 'three': 3}

须要注意的是,zip能够从任意可迭代对象中取元素,而集合/字典中的元素顺序是不定的,因此并行取出来的顺序可能不像想象中在位置上那般一一对应。

>>> L1={"one","two","three"}
>>> L2=[1,2,3]
>>> list(zip(L1,L2))
[('one', 1), ('three', 2), ('two', 3)]

filter

Python中的filter函数相似于Perl中的grep,用于从可迭代对象中筛选出元素被函数操做后为True的元素。

filter(function or None, iterable) --> filter object

例如,筛选出列表中字符串元素长度大于2的字符串:

>>> L = ["a","ab","abc","abcd"]
>>> L1 = filter( (lambda x: len(x) > 2), L )
>>> print(list(L1))
['abc', 'abcd']

上面的工做过程是迭代列表L,每取一个元素都放进函数中操做一番,若是这个元素放进函数中使得函数返回真,则保留这个元素,不然丢弃这个元素。

若是filter的函数部分为None,则表示直接从可迭代对象中取出元素为True的元素:

>>> list(filter(None,["a","ab",0,"","c"]))
['a', 'ab', 'c']

filter的返回结果是一个可迭代对象,能够进行迭代操做:

>>> for i in filter( (lambda x: len(x) > 2), L ): print(i)
...
abc
abcd

reduce

reduce的功能很是好用,看下面的示例:

>>> import functools
>>> functools.reduce(lambda x, y: x+y, [1,2,3,4,5])
15

它的语法为:

reduce(func, sequence[, initial]) -> value

reduce有两个过程:

  1. 先从sequence中取两个元素做为func的参数,该函数返回一个结果A。这是初始化的过程
  2. 将结果A与sequence的下一个元素做为func的参数,继续返回一个结果B,将结果B与下一个元素做为func参数,依次类推,直到迭代完sequence中全部元素

若是给reduce设置了initial参数,则跳过初始化的过程,直接将Initial与sequence的第一个元素做为func的参数。若是没有给定sequence,而给了Initial,则initial做为直接返回的默认值。

例如,从序列中取出最大值:

>>> reduce( lambda x, y: x if x > y else y, [1,2,3,4,5] )
5

>>> reduce( lambda x, y: x if x>y else y, [1,2,3,4,5],10 )
10

多迭代和单迭代

range()和zip()、map()、filter()稍有不一样。range()支持多迭代、然后三者只支持单迭代。

何为单迭代、何为多迭代?多迭代的意思是同一个对象上能够有多个互不影响的独立迭代器,各迭代器本身记住本身的迭代位置(状态信息)。单迭代的意思是同一个对象上只能有一个迭代器,即便建立了多个迭代器,它们也是串联起来互相影响的。

下面是range()的多迭代特性:

>>> R = range(3)   # 一个range对象R
>>> I1 = iter(R)   # range对象的一个迭代器
>>> I2 = iter(R)   # range对象的第二个迭代器
>>> next(I1)
0
>>> next(I1)
1
>>> next(I2)     # 和I1互不影响
0
>>> next(I2)
1
>>> next(I1)
2

下面的zip、map、filter单迭代的特性:

# zip的单迭代
>>> Z = zip([1,2,3],[10,11,12]) # 自身是迭代器
>>> I1 = iter(Z)       # 从自身获取可迭代对象I1
>>> I2 = iter(Z)       # 从自身获取可迭代对象I2
>>> next(I1)
(1, 10)
>>> next(I2)  # I1和I2迭代的是同一个对象:自身
(2, 11)
>>> next(I1)
(3, 12)

之因此range()支持多迭代,而zip/map/filter都只支持单迭代,是由于:

  1. zip/map/filter返回的是自身的迭代器,它们的返回结果自身同时都实现了__iter__()__next__()两个方法,因此不管从它们的返回结果上产生多少个可迭代对象,操做的都是它们的对象自身,从而只支持单迭代
  2. range返回的不是自身迭代器,它的返回结果只实现了__iter__而没有实现__next__,因此须要经过iter()来生成可迭代对象(迭代器)。不管使用iter()从该返回结果产生多少个可迭代对象,都是互相独立的可迭代对象,从而支持多迭代

因此通常来讲,不是自身迭代器的对象支持多个迭代器,而自身是自身迭代器的对象只支持单个迭代器。

常见的多迭代有range()和那些支持迭代的内置类型,好比字符串、列表、元组等。例如字符串的多迭代:

>>> S = "abc"
>>> for x in S:
...   for y in S:
...     print(x + y, end=" ")
aa ab ac ba bb bc ca cb cc
相关文章
相关标签/搜索