Python实用技法第15篇:筛选序列中的元素

上一篇文章: Python实用技法第14篇:根据字段将记录分组:itertools.groupby()
下一篇文章: Python实用技法第16篇:从字典中提取子集

一、需求🙀

序列中含有一些数据,咱们须要提取其中的值或根据某些标准对序列作删减,

二、解决方案😸

要筛选序列中的数据,一般最简单的方法是使用列表推导式。segmentfault

例如:函数

myList=[1,4,-5,10,-7,2,3,-1]
print([n for n in myList if n>0])
print([n for n in myList if n<0])

结果:工具

[1, 4, 10, 2, 3]
[-5, -7, -1]

使用列表推导式的一个潜在缺点是若是原始输入很是大的话,这么作可能会产生一个庞大的结果。若是这是你须要考虑的问题,那么可使用生成器表达式经过迭代的方法产生筛选结果,例如:code

myList=[1,4,-5,10,-7,2,3,-1]
pos=(n for n in myList if n >0)
for x in pos:
    print(x)

结果:对象

1
4
10
2
3

有时候筛选的标准无法简单地表示在列表推导式或生成器表达式中。好比:假设筛选过程涉及异常处理或者其余一些复杂的细节。能够将处理筛选逻辑的代码放到单独的函数中,而后使用内建的filter()函数处理,示例以下:get

values=['1','2','-3','-','4','N/A','5']
def is_int(val):
    try:
        x=int(val)
        return True
    except ValueError:
        return False

ivals=list(filter(is_int,values))
print(ivals)

结果:it

['1', '2', '-3', '4', '5']

filter()建立了一个迭代器,所以若是咱们想要的是列表形式的结果,请确保加上了list(),就像示例中那样。import

三、分析

列表推导式和生成器表达式一般是用来筛选数据的最简单和最直接的方式。此外,它们也具备同时对数据作转换的能力。例如:List

import math
myList=[1,4,-5,10,-7,2,3,-1]
print([math.sqrt(n) for n in myList if n>0])

结果:迭代器

[1.0, 2.0, 3.1622776601683795, 1.4142135623730951, 1.7320508075688772]

关于筛选数据,有一种状况是用新值替换掉不知足标准的值,而不是抛弃它们。例如。除了要找到正整数以外,咱们也但愿在指定范围内将不知足要求的值替换掉。一般,这能够经过将筛选条件迁移到一个条件表达式中来轻松实现,就像下面这样:

myList=[1,4,-5,10,-7,2,3,-1]
print([n if n>0 else 0 for n in myList])
print([n if n<0 else 0 for n in myList])

结果:

[1, 4, 0, 10, 0, 2, 3, 0]
[0, 0, -5, 0, -7, 0, 0, -1]

另外一个值得一提的筛选工具是itertools.compress(),它接受一个可迭代对象以及一个布尔选择器序列做为输入。输出时,它会给出全部在相应的布尔选择器中为True的可迭代对象元素。若是想把对一个序列的筛选结果施加到另外一个相关的序列上时,这就会很是有用。

例如:

from itertools import compress
address=[
'5412 N CLARK1',
'5148 N CLARK2',
'5800 E CLARK3',
'2122 N CLARK4',
'5645 M CLARK5',
'1060 W CLARK6',
]
counts=[0,3,10,4,1,7]
#构建一个列表,它相应的count值要大于5
more5=[n>5 for n in counts]
print(more5)

print(list(compress(address,more5)))

结果:

[False, False, True, False, False, True]
['5800 E CLARK3', '1060 W CLARK6']

这里的关键在于首先建立一个布尔序列,用来表示哪一个元素可知足咱们的条件,而后compress()函数挑选出知足布尔值为True的相应元素。

同filter()函数同样,正常状况下,compress()会返回一个迭代器。所以,若是须要的话,得使用list()将结果转为列表。

上一篇文章: Python实用技法第14篇:根据字段将记录分组:itertools.groupby()
下一篇文章: Python实用技法第16篇:从字典中提取子集
相关文章
相关标签/搜索