要想理解yield
, 须要先理解generators
(生成器), 要想理解generators
, 须要先理解iterables(迭代器)python
先看这段代码:code
>>> mylist = [1, 2, 3] >>> for i in mylist: ... print(i) 1 2 3 >>> mylist2 = [x for x in range(3)] >>> for i in mylist2: ... print i ... 0 1 2
这段代码的意思是list(列表)在python中是能够迭代的, 若是你须要一个接一个的访问一个数据集合, 大多数的时候使用一个for xx in yy
这种方式, 那么这里的yy
就是一个能够迭代访问的数据集合, 很明显, list
, tuple
, string
, file
这些都是迭代器内存
iterables
是保存在内存中的, 你能够随便访问他们, 好比上面的mylist
,mylist2
get
再看这一段generator
>>> mygenerator = (x*x for x in range(3)) >>> for i in mygenerator: ... print(i) 0 1 4 >>> mygenerator <generator object <genexpr> at 0x10d35eaa0>
这段代码中mygenerator
就是一个迭代器, 跟上文的mylist2
生成方式有点点区别, []
改为了()
, 从使用上来讲, generators
和iterables
都是相似for in
的这种方式string
可是 : generators
不是保存在内存中的, 而是惰性加载的, 也就是你用到它的时候, 它才临时去计算, 只能使用一次for in
, 好比上面的mygenerator
, 计算0*0
并返回以后就不在保留了, 继续计算1*1
it
适用场景: 当须要迭代访问一组量很是大的数据集的时候, generator
是很是有用的, 由于它计算完了前面的数据而后就计算后面, 并不在内存里保留全部的数据, 这样就不至于内存爆掉io
理解了generator
以后, 再来看yield
就很是好理解了, 能够把yield
当成return
看待object
>>> def createGenerator(): ... mylist = range(3) ... for i in mylist: ... yield i*i ... >>> mygenerator = createGenerator() # 建立一个生成器, 这里createGenerator内的代码并无运行 >>> print(mygenerator) # 生成器就是一个object <generator object createGenerator at 0xb7555c34> >>> >>> for i in mygenerator: # 这里createGenerator内的代码才开始运行 ... print(i) 0 1 4
上面的代码中当调用createGenerator()
的时候, 其实方法内的代码并无运行, 而在for in
循环访问的时候, 才开始从头计算, 当运行到yield
的时候返回第一个值, 而后就停
下来, 当再次请求数据的时候继续运算直到再次碰到yield
... 直到没有值能够返回file