从一个问题来看解析式,现有以下需求:生成一个列表,元素0-9,对每个元素自增1后求平方返回新列表。app
lst = list(range(10)) lst2 = [] for value in lst: lst2.append((value + 1) ** 2) print(lst2)
看起来很容易理解,可是这种需求居然用了5行代码!下面来看一下列表解析式的写法。函数
[ (x+1)**2 for x in range(10)]
看起来很是简洁,属于Python的风格!哈哈性能
再来看一下,什么是列表解析式?在Python中列表解析式是一种语法糖,虽然对看似复杂的代码进行了简写,可是编译器会进行优化,不会由于简写而影响效率,反而由于优化提升了效率。另外还介绍了代码量,减小了出错的机会,还简化了代码,增长了代码可读性。学习
列表解析式的基本语法是以下优化
[ 返回值 for 元素 in 可迭代对象 if 条件]
中括号
将表达式(推导式)括起来elif语句
有这样的赋值语句 newlist = [ print(i) for i in range(10) ]
,请问newlist打印出来是什么?code
In [6]: newlist = [ print(i) for i in range(10) ] 0 1 2 3 4 5 6 7 8 9 In [7]: newlist Out[7]: [None, None, None, None, None, None, None, None, None, None]
为何是None?由于表达式只会将函数的返回值做为结果,进行添加,因此当返回值是一个函数操做的对象时,必定要注意函数的返回值!对象
有的时候咱们的代码须要进行两个或多个循环,列表解析式进阶版本能够知足这种需求哦。它的语法是:ip
[ 返回值 for 元素 in 可迭代对象 if 条件表达式1 if 条件表达式2 ... ] 等同于: for 元素 in 可迭代对象: if 条件表达式1: if 条件表达式2: 返回值 [ 返回值 for 元素 in 可迭代对象1 for 元素 in 可迭代对象2 ... ] 等同于: for 元素1 in 可迭代对象1: for 元素2 in 可迭代对象2: # if 也能够加条件判断 返回值[1个或多个]
例子:内存
20之内,既能被2整除,又能被3整除的列表 [ i for i in range(20) if i % 2 == 0 if i % 3 == 0] [(i,j) for i in range(10) for j in range(20) if i < 3 if j > 18] 表示当i小于3时,j大于18时,组成一个元素返回
除了列表解析式之外,Python中还存在集合解析式
、字典解析式
、'元组解析式'
。
可不是什么元组解析式,这行小字你看不到,可不怪我哦。
{ 返回值 for 元素 in 可迭代对象 if 条件 }
{}
便可20之内,既能被2整除,又能被3整除的集合 { i for i in range(20) if i % 2 == 0 if i % 3 == 0}
注意集合的特性,若是生成了不可hash的元素好比list,那么是不能生成集合的哦,若是元素重复,集合会去重的哦
{ 返回值(key:value) for 元素 in 可迭代对象 if 条件 }
{}
便可生成一个key为abcded的字典 {x:y for x in 'abcdef' for y in range(10)}
注意字典的key相同时,后面的赋值会把以前的值覆盖哦,因此结果是
{'a': 9, 'b': 9, 'c': 9, 'd': 9, 'e': 9, 'f': 9}
若是你是从上倒下看的,那么你可能会奇怪,说好的元组表达式呢?若是你是直接跳转过来的,那么请忽略前面这句话。那什么是生成器表达式呢?
生成器表达式是按需计算(或者惰性求值、延迟计算)的,只有须要的时候才计算值,而列表解析式是直接返回一个新的列表,生成器是一个可迭代对象
,迭代器
。在使用type命令判断对象类型时,generator
就表示一个生成器对象
()
便可延迟计算(惰性计算)
只能迭代一次,不能回头
g = ((i,j) for i in range(10) for j in range(20) if i < 3 if j > 18) print(g) # <generator object <genexpr> at 0x7fca2552b258> for i in g: print(i) # 只能迭代一次,迭代完毕生成器就为空了哦,
没错,用括号括起来的并非元组表达式,而变成了生成器表达式
,它自己因为惰性计算的特性和其余解析式有不少不一样的特性
计算方式
内存占用
计算速度
遍历
当咱们须要对数据进行遍历时,因为生成器是遍历一次计算一个返给你,而列表解析式执行完毕后直接返回一个新的列表不须要计算,因此性能要优于生成器表达式。
除了遍历咱们还能够经过
next方法
来一次一次的获取生成器的数据
In [8]: g = ((i,j) for i in range(10) for j in range(20) if i < 3 if j > 18) In [9]: next(g) Out[9]: (0, 19) In [10]: next(g) Out[10]: (1, 19) In [11]: next(g) Out[11]: (2, 19) In [12]: next(g) --------------------------------------------------------------------------- StopIteration Traceback (most recent call last) <ipython-input-12-e734f8aca5ac> in <module> ----> 1 next(g) StopIteration: In [13]:
next()能够理解为向生成器要一次数据(拨一下生成器),当生成器为空时,就会提示
StopIteration
异常,for循环帮咱们对StopIteration异常作了处理,尚未学习异常处理的咱们,该怎么办呢?其实next方法为咱们提供了默认值参数
,即从生成器中拿不到数据,就返回指定的默认:next(g[, default])
。
In [13]: g = ((i,j) for i in range(10) for j in range(20) if i < 3 if j > 18) In [14]: next(g, 'None') Out[14]: (0, 19) In [15]: next(g, 'None') Out[15]: (1, 19) In [16]: next(g, 'None') Out[16]: (2, 19) In [17]: next(g, 'None') # 生成器空了,就返回default指定的默认值 Out[17]: 'None' In [18]: next(g, 'None') Out[18]: 'None'
Python2 引入列表解析式,Python2.4引入生成器表达式,Python3 引入集合、字典解析式,并迁移到了Python 2.7,通常来讲,应该多用解析式,简短、高效不过还须要注意的是:
从是否可迭代来看生成器、迭代器、可迭代对象的关系是以下