python:容器、迭代器、生成器 简单介绍

python:容器、迭代器、生成器 简单介绍

python提供了多种数据类型来存放数据项。
以前已经介绍了几个python中经常使用的容器,分别是列表list、元组tuple、字典dict和集合set。
这几种数据结构在Python中是很是重要的部分,尤为是各自的特性部分。掌握好了,处理数据的时候会很方便。java

容器 container

容器是一种把多个元素组织在一块儿的数据结构。容器中的元素能够经过for循环逐个地迭代获取,也能够经过in关键字来判断元素是否在容器中。
在Python中,常见的容器对象:python

  • list、dequeue...
  • set、frozenset...
  • dict、defaultdict、OrderDict...
  • tuple、namedtuple...
  • str
  • file
引用一张以前从其余博文上截的图,以为很形象,很好的解释了之间的关系。不过很差意思,出处找不到了
clipboard.png

大部分容器都提供了某种方式能够获取到其中的每个元素,可是这并非容器自己提供的功能,而是可迭代对象赋予了容器这种能力。算法

迭代 iteration

什么叫迭代?

若是给定一个list或者tuple数据类型变量,咱们能够经过for循环来遍历这个list或者tuple,那这种遍历能够成为迭代。编程

  • 在java中,迭代list是经过下标index来完成的,例如:
for (i=0;i<param.length;i++){
    val = param[index];
}
# 刚好最近在从新捡起java
  • 在Python中,迭代是经过for...in 循环完成的。Python中的for循环能够用在string、list、tuple、dict等其余可迭代对象上。例如:
>>> d = {'a':1,'b':2,'c':3}  
>>> for key in d:     # dict
...     print(key)
...
a
b
c
>>> for ch in 'AB':   # str 
... print(ch)
...
A
B

因此,当咱们使用for循环时,咱们不太去关心做用的对象到底是list、tuple仍是其余数据类型,只要做用于一个可迭代对象上,for循环就能够正常运行。
so...数据结构

可迭代对象 iterable

可迭代对象,Iterable。可直接使用for循环的对象统称为可迭代对象。
那么你可能会问,如何去判断一个对象是不是可迭代对象呢?
ans:方法是经过引入collections模块中的Iterable类型来判断,同时使用isinstance()。函数

>>> from collections import Iterable    # 引入Iterable
>>> isinstance('abc',Iterable)
True
>>> isinstance(123,Iterable)
False
  • 补充一小点知识,如何经过for循环,把list的索引和值都读出来呢?使用 enumerate() 来完成。

Python内置的enumerate()枚举函数能够把一个list编程索引-元素对,这样就能够在for循环中同时迭代索引和元素自己。以下:spa

>>> l=['a','b','c','d']
>>> for ind,val in enumerate(l):
...        print("%d %s"%(ind,val))
...
0 a
1 b
2 c
3 d

迭代器 iterator

能够被next()函数调用并不断返回下一个值的对象为迭代器,iterator。
Python中的iterator对象是一个带状态的对象,表示的是一个数据流,他实现了以下两个方法:code

  • __iter__:返回迭代器自己;
  • __next__:返回容器的下一个元素;

虽然list、dict、tuple是能够迭代的对象,但不是迭代器。
可是可迭代对象实现了__iter__方法,该方法返回一个迭代器对象。对象

如何建立迭代器

  • iter()

如何建立一个可迭代对象?经过调用iter()方法实现,以下图所示:blog

clipboard.png

  • next()

可迭代对象能够被next()调用并不断返回下一个数据,直到没有数据时抛出StopIteration错误。以下:

clipboard.png

咱们能够想象迭代器数据流看作是一个有序的序列,可是不能提早知道序列到底有多长,只能不断经过next()函数来实现读取下一个数据。
因此Iterator的计算是一个惰性的,至于在须要返回下一个数据时,他才会计算。

Iterator甚至能够表示一个无限大的数据流,例如全体天然数。而使用list是永远不可能存储全体天然数的。

生成器 generator

生成器是一种特殊的迭代器。
一个函数只返回一次,但一个生成器能暂停执行并返回一个中间的结果,当生成器的next()方法被调用时,它就又会从离开的地方继续运行,实现一边循环一边计算的机制,这种就称为生成器generator

生成器建立方法

生产器的建立方法有两种:一是生成器表达式;二是yield关键字。

  • 生成器表达式

    直接上例子啦:注意一点就是,生成器最外层的是“()”,list最外成是“[]”。

>>> g = ( x*x for x in range(10) )
>>> g
<generator object <genexpr> at 0x010B3690>
# 使用next()来得到generator的下一个返回值
>>> next(g)
0
>>> next(g)
1
# g保存的是算法,每次调用next(g),就计算出下一个元素的值,直到没有更多元素时抛错
  • yield关键字

若是一个函数定义中包含yield关键字,那么这个函数就再也不是一个普通的函数,而是一个generator。
例如,用函数实现斐波那契数列,咱们可使用以下方法:

def fib(max):
    n,a,b = 0,0,1
while n < max:
    print(b)
    a,b=b,a+b
    n = n + 1
    return 'done'

其中,fib()定义了斐波那契的推算规则。
那咱们能够把fib()变成generator。以下:

def fib():
    prev,curr = 0,1
    while True:
        yield curr
        prev,curr = curr , curr + prev

上述函数体中,返回值不是return关键字了,而是yield,函数返回值是一个生成器对象。
当执行f=fib()时返回的是一个生成器对象,此时函数体中的代码不会执行,只有显示或隐式调用next()的时候才会真正执行里面的代码。
在每次调用next()的时候执行,遇到yield语句返回,再次执行时,从上次返回的yield语句处继续执行。
咱们能够经过一个例子演示说明:

>>> def odd():
...     print('step1')
...     yield 1
...     print('step2')
...     yield 2
...     print('step 3')
...     yield 3
...
>>> o = odd()
>>> next(o)
step1
1
>>> next(o)
step2
2

好啦,今天就写到这~


❤ thanks for watching, keep on updating...

相关文章
相关标签/搜索