真正的 Tornado 异步非阻塞

时间 2019-11-16

标签真正 tornado 异步阻塞栏目 Python 繁體版

原文原文链接

其中 Tornado 的定义是 Web 框架和异步网络库，其中他具有有异步非阻塞能力，能解决他两个框架请求阻塞的问题，在须要并发能力时候就应该使用 Tornado。python

可是在实际使用过程当中很容易把 Tornado 使用成异步阻塞框架，这样对比其余两大框架没有任何优点而言，本文就如何实现真正的异步非阻塞记录。git

如下使用的 Python 版本为 2.7.13github

平台为 Macbook Pro 2016web

使用 gen.coroutine 异步编程

在 Tornado 中两个装饰器：编程

tornado.web.asynchronous
tornado.gen.coroutine

asynchronous 装饰器是让请求变成长链接的方式，必须手动调用 self.finish() 才会响应网络

class MainHandler(tornado.web.RequestHandler):
 @tornado.web.asynchronous
    def get(self):
        # bad 
        self.write("Hello, world")复制代码

asynchronous 装饰器不会自动调用self.finish() ，若是没有没有指定结束，该长链接会一直保持直到 pending 状态。并发

因此正确是使用方式是使用了 asynchronous 须要手动 finishapp

class MainHandler(tornado.web.RequestHandler):
 @tornado.web.asynchronous
    def get(self):
        self.write("Hello, world")
        self.finish()复制代码

coroutine 装饰器是指定改请求为协程模式，说明白点就是能使用 yield 配合 Tornado 编写异步程序。框架

Tronado 为协程实现了一套本身的协议，不能使用 Python 普通的生成器。异步

在使用协程模式编程以前要知道如何编写 Tornado 中的异步函数，Tornado 提供了多种的异步编写形式：回调、Future、协程等，其中以协程模式最是简单和用的最多。

编写一个基于协程的异步函数一样须要 coroutine 装饰器

@gen.coroutine
def sleep(self):
    yield gen.sleep(10)
    raise gen.Return([1, 2, 3, 4, 5])复制代码

这就是一个异步函数，Tornado 的协程异步函数有两个特色：

须要使用 coroutine 装饰器
返回值须要使用 raise gen.Return() 当作异常抛出

返回值做为异常抛出是由于在 Python 3.2 以前生成器是不容许有返回值的。

使用过 Python 生成器应该知道，想要启动生成器的话必须手动执行 next() 方法才行，因此这里的 coroutine 装饰器的其中一个做用就是在调用这个异步函数时候自动执行生成器。

使用 coroutine 方式有个很明显是缺点就是严重依赖第三方库的实现，若是库自己不支持 Tornado 的异步操做再怎么使用协程也是白搭依然会是阻塞的，放个例子感觉一下。

import time
import logging
import tornado.ioloop
import tornado.web
import tornado.options
from tornado import gen

tornado.options.parse_command_line()

class MainHandler(tornado.web.RequestHandler):
 @tornado.web.asynchronous
    def get(self):
        self.write("Hello, world")
        self.finish()


class NoBlockingHnadler(tornado.web.RequestHandler):
 @gen.coroutine
    def get(self):
        yield gen.sleep(10)
        self.write('Blocking Request')


class BlockingHnadler(tornado.web.RequestHandler):
    def get(self):
        time.sleep(10)
        self.write('Blocking Request')

def make_app():
    return tornado.web.Application([
        (r"/", MainHandler),
        (r"/block", BlockingHnadler),
        (r"/noblock", NoBlockingHnadler),
    ], autoreload=True)

if __name__ == "__main__":
    app = make_app()
    app.listen(8000)
    tornado.ioloop.IOLoop.current().start()复制代码

为了显示更明显设置了 10 秒

当咱们使用 yield gen.sleep(10) 这个异步的 sleep 时候其余请求是不阻塞的。

当使用 time.sleep(10) 时候会阻塞其余的请求。

这里的异步非阻塞是针对另外一请求来讲的，本次的请求该是阻塞的仍然是阻塞的。

gen.coroutine 在 Tornado 3.1 后会自动调用 self.finish() 结束请求，能够不使用 asynchronous 装饰器。

因此这种实现异步非阻塞的方式须要依赖大量的基于 Tornado 协议的异步库，使用上比较局限，好在仍是有一些能够用的异步库

基于线程的异步编程

使用 gen.coroutine 装饰器编写异步函数，若是库自己不支持异步，那么响应任然是阻塞的。

在 Tornado 中有个装饰器能使用 ThreadPoolExecutor 来让阻塞过程编程非阻塞，其原理是在 Tornado 自己这个线程以外另外启动一个线程来执行阻塞的程序，从而让 Tornado 变得阻塞。

futures 在 Python3 是标准库，可是在 Python2 中须要手动安装

pip install futures

import time
import logging
import tornado.ioloop
import tornado.web
import tornado.options
from tornado import gen
from tornado.concurrent import run_on_executor
from concurrent.futures import ThreadPoolExecutor

tornado.options.parse_command_line()

class MainHandler(tornado.web.RequestHandler):
 @tornado.web.asynchronous
    def get(self):
        self.write("Hello, world")
        self.finish()


class NoBlockingHnadler(tornado.web.RequestHandler):
    executor = ThreadPoolExecutor(4)

 @run_on_executor
    def sleep(self, second):
        time.sleep(second)
        return second

 @gen.coroutine
    def get(self):
        second = yield self.sleep(5)
        self.write('noBlocking Request: {}'.format(second))

def make_app():
    return tornado.web.Application([
        (r"/", MainHandler),
        (r"/noblock", NoBlockingHnadler),
    ], autoreload=True)

if __name__ == "__main__":
    app = make_app()
    app.listen(8000)
    tornado.ioloop.IOLoop.current().start()复制代码

ThreadPoolExecutor 是对标准库中的 threading 的高度封装，利用线程的方式让阻塞函数异步化，解决了不少库是不支持异步的问题。

可是与之而来的问题是，若是大量使用线程化的异步函数作一些高负载的活动，会致使该 Tornado 进程性能低下响应缓慢，这只是从一个问题到了另外一个问题而已。

因此在处理一些小负载的工做，是能起到很好的效果，让 Tornado 异步非阻塞的跑起来。

可是明明知道这个函数中作的是高负载的工做，那么你应该采用另外一种方式，使用 Tornado 结合 Celery 来实现异步非阻塞。

基于 Celery 的异步编程

Celery 是一个简单、灵活且可靠的，处理大量消息的分布式系统，专一于实时处理的任务队列，同时也支持任务调度。

Celery 并非惟一选择，你可选择其余的任务队列来实现，可是 Celery 是 Python 所编写，能很快的上手，同时 Celery 提供了优雅的接口，易于与 Python Web 框架集成等特色。

与 Tornado 的配合可使用 tornado-celery ，该包已经把 Celery 封装到 Tornado 中，能够直接使用。

实际测试中，因为 tornado-celery 好久没有更新，致使请求会一直阻塞，不会返回

解决办法是：

把 celery 降级到 3.1 pip install celery==3.1

把 pika 降级到 0.9.14 pip install pika==0.9.14

import time
import logging
import tornado.ioloop
import tornado.web
import tornado.options
from tornado import gen

import tcelery, tasks

tornado.options.parse_command_line()
tcelery.setup_nonblocking_producer()


class MainHandler(tornado.web.RequestHandler):
 @tornado.web.asynchronous
    def get(self):
        self.write("Hello, world")
        self.finish()


class CeleryHandler(tornado.web.RequestHandler):
 @gen.coroutine
    def get(self):
        response = yield gen.Task(tasks.sleep.apply_async, args=[5])
        self.write('CeleryBlocking Request: {}'.format(response.result))


def make_app(): 
    return tornado.web.Application([
        (r"/", MainHandler),
        (r"/celery-block", CeleryHandler),
    ], autoreload=True)

if __name__ == "__main__":
    app = make_app()
    app.listen(8000)
    tornado.ioloop.IOLoop.current().start()复制代码

import os
import time
from celery import Celery
from tornado import gen

celery = Celery("tasks", broker="amqp://")
celery.conf.CELERY_RESULT_BACKEND = os.environ.get('CELERY_RESULT_BACKEND', 'amqp')

@celery.task
def sleep(seconds):
    time.sleep(float(seconds))
    return seconds

if __name__ == "__main__":
    celery.start()复制代码

Celery 的 Worker 运行在另外一个进程中，独立于 Tornado 进程，不会影响 Tornado 运行效率，在处理复杂任务时候比进程模式更有效率。

总结

方法	优势	缺点	可用性
gen.coroutine	简单、优雅	须要异步库支持	★★☆☆☆
线程	简单	可能会影响性能	★★★☆☆
Celery	性能好	操做复杂、版本低	★★★☆☆

目前没有找到最佳的异步非阻塞的编程模式，可用的异步库比较局限，只有常常用的，我的编写异步库比较困难。

推荐使用线程和 Celery 的模式进行异步编程，轻量级的放在线程中执行，复杂的放在 Celery 中执行。固然若是有异步库使用那最好不过了。

Python 3 中能够把 Tornado 设置为 asyncio 的模式，这样就使用兼容 asyncio 模式的库，这应该是往后的方向。

真正的 Tornado 异步非阻塞

使用 gen.coroutine 异步编程

基于线程的异步编程

基于 Celery 的异步编程

总结

Reference