编程大神进阶之路：Python技巧小贴士

时间 2019-11-05

原文原文链接

选自medium，做者：Martin Heinz，机器之心编译，参与：王子嘉、熊宇轩。python

介绍 Python 炫酷功能（例如，变量解包，偏函数，枚举可迭代对象等）的文章层出不穷。可是还有不少 Python 的编程小技巧鲜被说起。所以，本文会试着介绍一些其它文章没有提到的小技巧，这些小技巧也是我平时会用到的的。让咱们一探究竟吧！正则表达式

整理字符串输入

整理用户输入的问题在编程过程当中极为常见。一般状况下，将字符转换为小写或大写就够了，有时你可使用正则表达式模块「Regex」完成这项工做。可是若是问题很复杂，可能有更好的方法来解决：编程

user_input = "This\nstring has\tsome whitespaces...\r\n"character_map = {    ord('\n') : ' ',    ord('\t') : ' ',    ord('\r') : None}user_input.translate(character_map)  # This string has some whitespaces... 复制代码

在本例中，你能够看到空格符「\ n」和「\ t」都被替换成了单个空格，「\ r」都被删掉了。这只是个很简单的例子，咱们能够更进一步，使用「unicodedata」程序包生成大型重映射表，并使用其中的「combining()」进行生成和映射，咱们能够
数组

迭代器切片（Slice）bash

若是对迭代器进行切片操做，会返回一个「TypeError」，提示生成器对象没有下标，可是咱们能够用一个简单的方案来解决这个问题：

import itertoolss = itertools.islice(range(50), 10, 20)  # &lt;itertools.islice object at 0x7f70fab88138&gt;for val in s: ...复制代码

咱们可使用「itertools.islice」建立一个「islice」对象，该对象是一个迭代器，能够产生咱们想要的项。但须要注意的是，该操做要使用切片以前的全部生成器项，以及「islice」对象中的全部项。

跳过可迭代对象的开头app

有时你要处理一些以不须要的行（如注释）开头的文件。「itertools」再次提供了一种简单的解决方案：

string_from_file = """// Author: ...// License: ...//// Date: ...Actual content..."""import itertoolsfor line in itertools.dropwhile(lambda line: line.startswith("//"), string_from_file.split("\n")):    print(line)复制代码

这段代码只打印初始注释部分以后的内容。若是咱们只想舍弃可迭代对象的开头部分（本示例中为开头的注释行），而又不知道要这部分有多长时，这种方法就颇有用了。

只包含关键字参数的函数 (kwargs)ide

当咱们使用下面的函数时，建立仅仅须要关键字参数做为输入的函数来提供更清晰的函数定义，会颇有帮助：

def test(*, a, b):    passtest("value for a", "value for b")  # TypeError: test() takes 0 positional arguments...test(a="value", b="value 2") # Works...复制代码

如你所见，在关键字参数以前加上一个「*」就能够解决这个问题。若是咱们将某些参数放在「*」参数以前，它们显然是位置参数。

建立支持「with」语句的对象函数

举例而言，咱们都知道如何使用「with」语句打开文件或获取锁，可是咱们能够实现本身上下文表达式吗？是的，咱们可使用「__enter__」和「__exit__」来实现上下文管理协议:

class Connection:    def __init__(self):        ...    def __enter__(self):        # Initialize connection... def __exit__(self, type, value, traceback): # Close connection...with Connection() as c: # __enter__() executes ... # conn.__exit__() executes复制代码

这是在 Python 中最多见的实现上下文管理的方法，可是还有更简单的方法:

from contextlib import contextmanager@contextmanagerdef tag(name):    print(f"<{name}>")    yield    print(f"</{name}>")with tag("h1"):    print("This is Title.")复制代码

上面这段代码使用 contextmanager 的 manager 装饰器实现了内容管理协议。在进入 with 块时 tag 函数的第一部分（在 yield 以前的部分）就已经执行了，而后 with 块才被执行，最后执行 tag 函数的其他部分。

用「__slots__」节省内存优化

若是你曾经编写过一个建立了某种类的大量实例的程序，那么你可能已经注意到，你的程序忽然须要大量的内存。那是由于 Python 使用字典来表示类实例的属性，这使其速度很快，但内存使用效率却不是很高。一般状况下，这并非一个严重的问题。可是，若是你的程序所以受到严重的影响，不妨试一下「__slots__」：ui

class Person:    __slots__ = ["first_name", "last_name", "phone"]    def __init__(self, first_name, last_name, phone):        self.first_name = first_name        self.last_name = last_name        self.phone = phone复制代码

当咱们定义了「__slots__」属性时，Python 没有使用字典来表示属性，而是使用小的固定大小的数组，这大大减小了每一个实例所需的内存。使用「__slots__」也有一些缺点：咱们不能声明任何新的属性，咱们只能使用「__slots__」上现有的属性。并且，带有「__slots__」的类不能使用多重继承。

限制「CPU」和内存使用量

若是不是想优化程序对内存或 CPU 的使用率，而是想直接将其限制为某个肯定的数字，Python 也有一个对应的库能够作到：

import signalimport resourceimport os# To Limit CPU timedef time_exceeded(signo, frame): print("CPU exceeded...") raise SystemExit(1)def set_max_runtime(seconds): # Install the signal handler and set a resource limit soft, hard = resource.getrlimit(resource.RLIMIT_CPU) resource.setrlimit(resource.RLIMIT_CPU, (seconds, hard)) signal.signal(signal.SIGXCPU, time_exceeded)# To limit memory usagedef set_max_memory(size): soft, hard = resource.getrlimit(resource.RLIMIT_AS) resource.setrlimit(resource.RLIMIT_AS, (size, hard))复制代码

咱们能够看到，在上面的代码片断中，同时包含设置最大 CPU 运行时间和最大内存使用限制的选项。在限制 CPU 的运行时间时，咱们首先得到该特定资源（RLIMIT_CPU）的软限制和硬限制，而后使用经过参数指定的秒数和先前检索到的硬限制来进行设置。最后，若是 CPU 的运行时间超过了限制，咱们将发出系统退出的信号。在内存使用方面，咱们再次检索软限制和硬限制，并使用带「size」参数的「setrlimit」和先前检索到的硬限制来设置它。

控制能够/不能够导入什么

有些语言有很是明显的机制来导出成员（变量、方法、接口），例如在 Golang 中只有以大写字母开头的成员被导出。然而，在 Python 中，全部成员都会被导出（除非咱们使用了「__all__」）：

def foo():    passdef bar():    pass__all__ = ["bar"]复制代码

在上面这段代码中，咱们知道只有「bar」函数被导出了。一样，咱们可让「__all__」为空，这样就不会导出任何东西，当从这个模块导入的时候，会形成「AttributeError」。

实现比较运算符的简单方法

为一个类实现全部的比较运算符（如 __lt__ , __le__ , __gt__ , __ge__）是很繁琐的。有更简单的方法能够作到这一点吗？这种时候，「functools.total_ordering」就是一个很好的帮手：

from functools import total_ordering@total_orderingclass Number:    def __init__(self, value):        self.value = value    def __lt__(self, other):        return self.value < other.value    def __eq__(self, other):        return self.value == other.valueprint(Number(20) > Number(3))print(Number(1) < Number(5))print(Number(15) >= Number(15))print(Number(10) <= Number(2))复制代码

这里的工做原理到底是怎样的呢？咱们用「total_ordering」装饰器简化实现对类实例排序的过程。咱们只须要定义「__lt__」和「__eq__」就能够了，它们是实现其他操做所须要的最小的操做集合（这里也体现了装饰器的做用——为咱们填补空白）。

结语

并不是本文中全部提到的功能在平常的 Python 编程中都是必需或有用的，可是其中某些功能可能会不时派上用场，并且它们也可能简化一些本来就很冗长且使人烦恼的任务。还需指出的是，全部这些功能都是 Python 标准库的一部分。而在我看来，其中一些功能彷佛并不像标准库中包含的标准内容，因此当你使用 Python 实现本文提到的某些功能时，请先参阅 Python 的标准库，若是你不能找到想要的功能，可能只是由于你尚未尽力查找（若是真的没有，那它确定也存在于一些第三方库）。

原文连接：

medium.com/m/global-id…