迭代器跟生成器,与上篇文章讲的装饰器同样,都是属于个人一个老大难问题。
一般就是遇到的时候就去搜一下,结果在一大坨各类介绍博客中看了看,回头又忘记了。
你是否是也是这样呢?python
俗话说:好记性不如烂笔头,虽然如今基本不咋用笔写字了,可是仍是要好好整理下,起码之后我就不用搜了。数据结构
若是如今给你一个列表list_a = [1, 2, 3, 4]
,让你去迭代它,相信你们都很熟悉,直接用for循环就完事儿,函数
list_a = [1, 2, 3, 4] for i in list_a: print(i)
运行测试
1 2 3 4 [Finished in 0.1s]
能够看到,for循环迭代了列表中的每个元素,打印了出来。
那么for循环背后都作了什么事情呢?code
听起来陌生,可是你绝对熟悉的词儿。对象
在python中,一切都是对象,对象的抽象是类,而对象的集合就是容器。内存
使用python中常见的容器有不少,好比:列表list:[0, 1, 2]
,集合set:([0, 1, 2])
,字典dict:{0:0, 1:1, 2:2}
以及元组tuple(0, 1, 2)
。
这些都是多个元素集中在一块儿的单元,区别的是内部数据结构的实现方法。generator
全部的容器都是能够迭代的,你能够用for循环去迭代上述的容器试试。博客
那把一个个元素找出来,用到的就是迭代器。用iter()能够建立一个迭代器。it
迭代器提供一个next()
方法,这个方法你每次调用的时候会给你返回下一个对象,或者StopIteration
,也就是没有对象能够给你了。
list_a = [1, 2, 3, 4] it = iter(list_a) # 建立迭代器 print(next(it)) #调用next() print(next(it)) print(next(it)) print(next(it)) print(next(it))
运行结果,前4个print能够正常返回,第5个时候就出现StopIteration
错误了,由于列表中4个元素已经返回完了。
1 2 3 4 Traceback (most recent call last): File "D:\练习\demo_iterator.py", line 9, in <module> print(next(it)) StopIteration [Finished in 0.1s with exit code 1]
什么是生成器?简单粗暴一点:生成器就是懒人版的迭代器。
在上述的建立迭代器操做中,咱们显然是作了一次性生成的操做,list_a = [1, 2, 3, 4]
,这4个元素一次性生成好,以供next()
调用。
可是生成出的这些元素都是会保存到内存中去,这只是4个元素,若是有上千万、上亿元素呢?
我并非第一时间要用到全部的元素,我只要在我调用next()
的时候产生一个返回给我就好,那么这样一次性生成就会白白占用了大量的内存。
生成器应运而生,当调用next()
的时候,才会生成下一个变量。
生成器的写法很简单,用小括号,好比把一个列表生成式括起来:(i for i in range(10000))
,这样就初始化了一个生成器。
print([i for i in range(10)]) print(i for i in range(10))
上面的时列表,下面的就是一个生成器了,区别就是[]
和()
。
运行结果:
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] <generator object <genexpr> at 0x033383A8> [Finished in 0.1s]
此外,函数也能够成为生成器,秘密就是yield
关键字,好比:
def gen(): a = 0 while a < 100: yield a a += 1 test = gen() print(next(test)) print(next(test)) print(next(test)) print(next(test))
运行结果:
0 1 2 3 [Finished in 0.1s]
yield
关键字,能够这样理解:当函数运行到这一行的时候,程序会从这里暂停,yield
至关于return
会返回,
当下次迭代时候,则会从yield
的下一行代码开始执行。
因此,我调用了4次print,能够从0开始依次输出。
从我工做中的使用场景出发的话,我在作一些自动化测试的时候,有些变量参数是不能够重复的,用迭代器来定义变量的生成规则,每次 调用都会产生一个新的,就不会重复了。