Python模块之subprocess

时间 2021-08-14

标签 python mysql sql shell 数据库 flask 缓存网络 app 运维栏目 Python 繁體版

原文原文链接

一简介
在使用Python 开发MySQL自动化相关的运维工具的时候，遇到一些有意思的问题，本文介绍Python的 subprocess 模块以及如何和MySQL交互具体操做，如启动，关闭，备份数据库。
二基础知识
Python2.4引入subprocess模块来管理子进程，能够像Linux 系统中执行shell命令那样fork一个子进程执行外部的命令，而且能够链接子进程的output/input/error管道，获取命令执行的输出，错误信息，和执行成功与否的结果。
Subprocess 提供了三个函数以不一样的方式建立子进程。他们分别是
2.1 subprocess.call()
父进程等待子进程完成，而且返回子进程执行的结果 0/1
其实现方式
python

def call(*popenargs, **kwargs):
mysql

return Popen(*popenargs, **kwargs).wait()sql

例子
shell

>>> out=subprocess.call(["ls", "-l"])
数据库

total 88
flask

drwxr-xr-x 5 yangyi staff 170 1 25 22:37 HelloWorld
缓存

drwxr-xr-x 11 yangyi staff 374 12 18 2015 app
网络

-rw-r--r-- 1 yangyi staff 3895 4 19 11:29 check_int.py
app

..... 省略一部分
运维

>>> print out

0

>>> out=subprocess.call(["ls", "-I"])

ls: illegal option -- I

usage: ls [-ABCFGHLOPRSTUWabcdefghiklmnopqrstuwx1] [file ...]

>>> print out

1

2.2 subprocess.check_call()

父进程等待子进程完成，正常状况下返回0,当检查退出信息，若是returncode不为0，则触发异常subprocess.CalledProcessError，该对象包含有returncode属性，应用程序中可用try...except...来检查命令是否执行成功。
其实现方式

def check_call(*popenargs, **kwargs):

    retcode = call(*popenargs, **kwargs)

    if retcode:

        cmd = kwargs.get("args")

        raise CalledProcessError(retcode, cmd)

    return 0

例子

>>> out=subprocess.check_call(["ls"])

HelloWorld    check_int.py    enumerate.py    hello.py

>>> print out

0

>>> out=subprocess.check_call(["ls",'-I']) #执行命令失败的时候回抛出CalledProcessError异常，而且返回结果1

ls: illegal option -- I

usage: ls [-ABCFGHLOPRSTUWabcdefghiklmnopqrstuwx1] [file ...]

Traceback (most recent call last):

  File "", line 1, in <module>

  File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/subprocess.py", line 540, in check_call

    raise CalledProcessError(retcode, cmd)

subprocess.CalledProcessError: Command '['ls', '-I']' returned non-zero exit status 1

2.3 subprocess.check_output()

和 subprocess.check_call() 相似，可是其返回的结果是执行命令的输出，而非返回0/1
其实现方式

def check_output(*popenargs, **kwargs):

    process = Popen(*popenargs, stdout=PIPE, **kwargs)

    output, unused_err = process.communicate()

    retcode = process.poll()

    if retcode:

        cmd = kwargs.get("args")

        raise CalledProcessError(retcode, cmd, output=output)

    return output

例子

>>> out=subprocess.check_output(["ls"]) #成功执行命令

>>> print out

HelloWorld

check_int.py

enumerate.py

flasky

hello.py

>>> out=subprocess.check_output(["ls","-I"])#执行命令出现异常直接打印出异常信息。

ls: illegal option -- I

usage: ls [-ABCFGHLOPRSTUWabcdefghiklmnopqrstuwx1] [file ...]

Traceback (most recent call last):

  File "", line 1, in <module>

  File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/subprocess.py", line 573, in check_output

    raise CalledProcessError(retcode, cmd, output=output)

subprocess.CalledProcessError: Command '['ls', '-I']' returned non-zero exit status 1

>>>

经过上面三个例子，咱们能够看出前面两个函数不容易控制输出内容,在使用subprocess包中的函数建立子进程执行命令的时候，须要考虑
1) 在建立子进程以后，父进程是否暂停，并等待子进程运行。
2) 如何处理函数返回的信息(命令执行的结果或者错误信息)
3) 当子进程执行的失败也即returncode不为0时，父进程如何处理后续流程?

三 subprocess的核心类 Popen()
认真的读者朋友能够看出上面三个函数都是基于Popen实现的，为啥呢？由于 subprocess 仅仅提供了一个类，call()，check_call(),check_outpu()都是基于Popen封装而成。当咱们须要更加自主的应用subprocess来实现应用程序的功能时，
咱们要本身动手直接使用Popen()生成的对象完成任务。接下来咱们研究Popen()的常见用法，详细的用法请参考官方文档

Popen(args, bufsize=0, executable=None, stdin=None, stdout=None, stderr=None, preexec_fn=None, close_fds=False, shell=False, cwd=None, env=None, universal_newlines=False, startupinfo=None, creationflags=0)

这里咱们只要掌握经常使用的参数便可
args 字符串或者列表，好比 "ls -a" / ["ls","-a"]
stdin/stdout/stderr 为None时表示没有任何重定向,继承父进程,还能够设置为PIPE 建立管道/文件对象/文件描述符(整数)/stderr 还能够设置为 STDOUT 后面会给出常见的用法
shell 是否使用shell来执行程序。当shell=True, 它将args看做是一个字符串，而不是一个序列。在Unix系统，且 shell=True时，shell默认使用 /bin/sh.
若是 args是一个字符串，则它声明了经过shell执行的命令。这意味着，字符串必需要使用正确的格式。
若是 args是一个序列，则第一个元素就是命令字符串，而其它的元素都做为参数使用。能够这样说，Popen等价于:
Popen(['/bin/sh', '-c', args[0], args[1], ...])

与上面第二部分介绍的三个函数不一样,subprocess.Popen() fork子进程以后主进程不会等待子进程结束，而是直接执行后续的命令。当咱们须要等待子进程结束必须使用wait()或者communicate()函数。举个例子，

import subprocess

sbp=subprocess.Popen(["ping","-c","5","www.youzan.com"])

print "ping is not done"

从执行结果上看，子进程 ping命令并未执行完毕，subprocess.Popen()后面的命令就开始执行了。

Popen常见的函数
Popen.poll() 用于检查子进程是否已经结束,设置并返回returncode属性。
Popen.wait() 等待子进程结束,设置并返回returncode属性。
Popen.communicate(input=None) 与子进程进行交互。向stdin发送数据，或从stdout和stderr中读取数据。可选参数input指定发送到子进程的参数。 Communicate()返回一个元组：(stdoutdata, stderrdata)。注意：若是但愿经过进程的stdin向其发送数据，在建立Popen对象的时候，参数stdin必须被设置为PIPE。一样，若是但愿从stdout和stderr获取数据，必须将stdout和stderr设置为PIPE。须要注意的是 communicate()是Popen对象的一个方法，该方法会阻塞父进程，直到子进程完成。
Popen.send_signal(signal) 向子进程发送信号。
Popen.terminate() 终止子进程。
Popen.kill() 杀死子进程。
Popen.pid 获取子进程的进程ID。
Popen.returncode 获取进程的返回值,成功时,返回0/失败时,返回 1。若是进程尚未结束，返回None。
这里须要多作说明的是
对于 wait() 官方提示

Warning This will deadlock when using stdout=PIPE and/or stderr=PIPE and the child process generates enough output to a pipe such that it blocks waiting for the OS pipe buffer to accept more data. Use communicate() to avoid that.

即当stdout/stdin设置为PIPE时，使用wait()可能会致使死锁。于是建议使用communicate
而对于communicate，文档又给出：

Interact with process: Send data to stdin. Read data from stdout and stderr, until end-of-file is reached. Wait for process to terminate. The optionalinput argument should be a string to be sent to the child process, orNone, if no data should be sent to the child.communicate() returns a tuple (stdoutdata, stderrdata).

Note that if you want to send data to the process’s stdin, you need to create the Popen object with stdin=PIPE. Similarly, to get anything other thanNone in the result tuple, you need to give stdout=PIPE and/orstderr=PIPE too.

Note

The data read is buffered in memory, so do not use this method if the data size is large or unlimited.

communicate会把数据读入内存缓存下来，因此当数据很大或者是无限的数据时不要使用。那么坑爹的问题来了：当你要使用Python的subprocess.Popen实现命令行之间的管道传输，同时数据源又很是大（好比读取上GB的文本或者无尽的网络流）时，官方文档不建议用wait，同时communicate还可能把内存撑爆,咱们该怎么操做？

四 Subprocess 和MySQL 的交互
纸上来得终觉浅，绝知此事要躬行。自动化运维需求中会有重启/关闭/备份/恢复 MySQL的需求。怎么使用Python的subprocess来解决呢？启动MySQL的命令以下

startMySQL="/usr/bin/mysqld_safe --defaults-file=/srv/my{0}/my.cnf --read_only=1 & ".format(port)

实际上使用child=subprocess.Popen(startMySQL,shell=True,stdout=stdout=subprocess.PIPE),子进程mysql_safe是无任何返回输出的,使用,child.communicate()或者读取stdout 则会持续等待。
须要使用 child.wait()或者child.poll()检查子进程是否执行完成。

import subprocess,time

def startMySQL(port):

    startMySQL="/usr/bin/mysqld_safe --defaults-file=/srv/my{0}/my.cnf --read_only=1 & ".format(port)

    child=subprocess.Popen(startMySQL, shell=True,stdout=subprocess.PIPE)

    child.poll()

    time.sleep(3) #有些MySQL实例启动可能须要必定的时间

    if child.returncode:

        print "instance {0} startup failed ...".format(port)

    else:

        print "instance {0} startup successed ...".format(port)

    return

root@rac3:~/python# >python 1.py

instance 3308 startup successed ...

五参考资料
[1] 官方文档
[2] Python中的subprocess与Pipe
[3] python类库31[进程subprocess]