用 tornado 作网站 (7)

时间 2019-11-21

标签 tornado 网站栏目 Python 繁體版

原文原文链接

转自：http://wiki.jikexueyuan.com/project/start-learning-python/309.html

用 tornado 作网站 (7)

到上一节结束，其实读者已经可以作一个网站了，可是，仅仅用前面的技术来作的网站，仅能算一个小网站，在《为作网站而准备》中，说明之因此选 tornado，就是由于它可以解决 c10k 问题，即可以实现大用户量访问。html

要实现大用户量访问，必需要作的就是：异步。除非你是很土的土豪。python

tornado 的同步

此前，在 tornado 基础上已经完成的 web，就是同步的、阻塞的。为了更明显的感觉这点，不妨这样试一试。

在 handlers 文件夹中创建一个文件，命名为 sleep.py

#!/usr/bin/env python # coding=utf-8 from base import BaseHandler import time class SleepHandler(BaseHandler): def get(self): time.sleep(17) self.render("sleep.html") class SeeHandler(BaseHandler): def get(self): self.render("see.html")

其它的事情，若是读者对我在《用 tornado 作网站 (1)》中所讲述的网站框架熟悉，应该知道如何作了，不熟悉，请回头复习。

sleep.html 和 see.html 是两个简单的模板，内容能够本身写。别忘记修改 url.py 中的目录。

而后的测试稍微复杂一点点，就是打开浏览器以后，打开两个标签，分别在两个标签中输入localhost:8000/sleep（记为标签 1）和 localhost:8000/see（记为标签 2），注意我用的是 8000 端口。输入以后先不要点击回车去访问。作好准备，记住切换标签能够用“ctrl-tab”组合键。

执行标签 1，让它访问网站；
立刻切换到标签 2，访问网址。
注意观察，两个标签页面，是否是都在显示正在访问，请等待。
当标签 1 不呈现等待提示（好比一个正在转的圆圈）时，标签 2 的表现如何？几乎同时也访问成功了。

建议读者修改 sleep.py 中的 time.sleep(17) 这个值，多试试。很好玩的吧。

固然，这是比较笨拙的方法，原本是能够经过测试工具完成上述操做比较的。怎奈要用别的工具，还要进行介绍，又多了一个分散精力的东西，故用如此笨拙的方法，权当有一个体会。

异步设置

tornado 原本就是一个异步的服务框架，体如今 tornado 的服务器和客户端的网络交互的异步上，起做用的是 tornado.ioloop.IOLoop。可是若是的客户端请求服务器以后，在执行某个方法的时候，好比上面的代码中执行 get() 方法的时候，遇到了 time.sleep(17) 这个须要执行时间比较长的操做，耗费时间，就会使整个 tornado 服务器的性能受限了。

为了解决这个问题，tornado 提供了一套异步机制，就是异步装饰器 @tornado.web.asynchronous：

#!/usr/bin/env Python # coding=utf-8 import tornado.web from base import BaseHandler import time class SleepHandler(BaseHandler): @tornado.web.asynchronous def get(self): tornado.ioloop.IOLoop.instance().add_timeout(time.time() + 17, callback=self.on_response) def on_response(self): self.render("sleep.html") self.finish()

将 sleep.py 的代码如上述同样改造，即在 get() 方法前面增长了装饰器 @tornado.web.asynchronous，它的做用在于将 tornado 服务器自己默认的设置_auto_fininsh 值修改成 false。若是不用这个装饰器，客户端访问服务器的 get() 方法并获得返回值以后，两只之间的链接就断开了，可是用了 @tornado.web.asynchronous 以后，这个链接就不关闭，直到执行了 self.finish() 才关闭这个链接。

tornado.ioloop.IOLoop.instance().add_timeout() 也是一个实现异步的函数，time.time()+17 是给前面函数提供一个参数，这样实现了至关于 time.sleep(17) 的功能，不过，尚未完成，当这个操做完成以后，就执行回调函数on_response() 中的 self.render("sleep.html")，并关闭链接 self.finish()。

过程清楚了。所谓异步，就是要解决原来的 time.sleep(17) 形成的服务器处理时间长，性能降低的问题。解决方法如上描述。

读者看这个代码，或许感受有点不是很舒服。若是有这么一点感受，是正常的。由于它里面除了装饰器以外，用到了一个回调函数，它让代码的逻辑不是平铺下去，而是被分割为了两段。第一段是tornado.ioloop.IOLoop.instance().add_timeout(time.time() + 17, callback=self.on_response)，用callback=self.on_response 来使用回调函数，并无如同改造以前直接 self.render("sleep.html")；第二段是回调函数 on_response(self)，要在这个函数里面执行self.render("sleep.html")，而且以self.finish()`结尾以关闭链接。

这仍是执行简单逻辑，若是复杂了，不断地要进行“回调”，没法让逻辑顺利延续，那面会“眩晕”了。这种现象被业界成为“代码逻辑拆分”，打破了原有逻辑的顺序性。为了让代码逻辑不至于被拆分的七零八落，因而就出现了另一种经常使用的方法：

#!/usr/bin/env Python # coding=utf-8 import tornado.web import tornado.gen from base import BaseHandler import time class SleepHandler(tornado.web.RequestHandler): @tornado.gen.coroutine def get(self): yield tornado.gen.Task(tornado.ioloop.IOLoop.instance().add_timeout, time.time() + 17) #yield tornado.gen.sleep(17) self.render("sleep.html")

从总体上看，这段代码避免了回调函数，看着顺利多了。

再看细节部分。

首先使用的是 @tornado.gen.coroutine 装饰器，因此要在前面有 import tornado.gen。跟这个装饰器相似的是@tornado.gen.engine 装饰器，二者功能相似，有一点细微差异。请阅读官方对此的解释：

This decorator(指 engine) is similar to coroutine, except it does not return a Future and the callback argument is not treated specially.

@tornado.gen.engine 是古时候用的，如今咱们都使用 @tornado.gen.corroutine 了，这个是在 tornado 3.0 之后开始。在网上查阅资料的时候，会遇到一些使用 @tornado.gen.engine 的，可是在你使用或者借鉴代码的时候，就勇敢地将其修改成 @tornado.gen.coroutine 好了。有了这个装饰器，就可以控制下面的生成器的流程了。

而后就看到 get() 方法里面的 yield 了，这是一个生成器（参阅本教程《生成器》）。yield tornado.gen.Task(tornado.ioloop.IOLoop.instance().add_timeout, time.time() + 17) 的执行过程，应该先看括号里面，跟前面的同样，是来替代 time.sleep(17) 的，而后是 tornado.gen.Task() 方法，其做用是“Adapts a callback-based asynchronous function for use in coroutines.”（因为怕翻译后遗漏信息，引用原文）。返回后，最后使用 yield 获得了一个生成器，先把流程挂起，等彻底完毕，再唤醒继续执行。要提醒读者，生成器都是异步的。

其实，上面啰嗦一对，能够用代码中注释了的一句话来代替 yield tornado.gen.sleep(17)，之因此扩所，就是为了顺便看到 tornado.gen.Task() 方法，由于若是读者在看古老的代码时候，会遇到。可是，后面你写的时候，就不要那么啰嗦了，请用 yield tornado.gen.sleep()。

至此，基本上对 tornado 的异步设置有了概览，不过，上面的程序在实际中没有什么价值。在工程中，要让 tornado 网站真正异步起来，还要作不少事情，不只仅是如上面的设置，由于不少东西，其实都不是异步的。

实践中的异步

如下各项同步（阻塞）的，若是在 tornado 中按照以前的方式只用它们，就是把 tornado 的非阻塞、异步优点削减了。

数据库的全部操做，无论你的数据是 SQL 仍是 noSQL，connect、insert、update 等
文件操做，打开，读取，写入等
time.sleep，在前面举例中已经看到了
smtplib，发邮件的操做
一些网络操做，好比 tornado 的 httpclient 以及 pycurl 等

除了以上，或许在编程实践中还会遇到其余的同步、阻塞实践。仅仅就上面几项，就是编程实践中常常会遇到的，怎么解决？

聪明的大牛程序员帮咱们作了扩展模块，专门用来实现异步/非阻塞的。

在数据库方面，因为种类繁多，不能一一说明，好比 mysql，可使用adb模块来实现 python 的异步 mysql 库；对于 mongodb 数据库，有一个很是优秀的模块，专门用于在 tornado 和 mongodb 上实现异步操做，它就是 motor。特别贴出它的 logo，我喜欢。官方网站：http://motor.readthedocs.org/en/stable/上的安装和使用方法都很详细。

文件操做方面也没有替代模块，只能尽可能控制好 IO，或者使用内存型（Redis）及文档型（MongoDB）数据库。
time.sleep() 在 tornado 中有替代：tornado.gen.sleep() 或者tornado.ioloop.IOLoop.instance().add_timeout，这在前面代码已经显示了。
smtp 发送邮件，推荐改成 tornado-smtp-client。
对于网络操做，要使用 tornado.httpclient.AsyncHTTPClient。

其它的解决方法，只能看到问题具体说了，甚至没有很好的解决方法。不过，这里有一个列表，列出了足够多的库，供使用者选择：Async Client Libraries built on tornado.ioloop，同时这个页面里面还有不少别的连接，都是很好的资源，建议读者多看看。

教程到这里，读者是否是要思考一个问题，既然对于 mongodb 有专门的 motor 库来实现异步，前面对于 tornado 的异步，无论是哪一个装饰器，都感受麻烦，有没有专门的库来实现这种异步呢？这不是异想天开，还真有。也应该有，由于这才体现python的特色。好比greenlet-tornado，就是一个不错的库。读者能够浏览官方网站深刻了解（为何对 mysql 那么不积极呢？按理说应该出来好多支持 mysql 异步的库才对）。

必须声明，前面演示如何在 tornado 中设置异步的代码，仅仅是演示理解设置方法。在工程实践中，那个代码的意义不到。为此，应该有一个近似于实践的代码示例。是的，的确应该有。当我正要写这样的代码时候，在网上发现一篇文章，这篇文章阻止了我写，由于我要写的那篇文章的做者早就写好了，并且我认为表述很是到位，示例也详细。因此，我不得不放弃，转而推荐给读者这篇好文章：

举例：http://emptysqua.re/blog/refactoring-tornado-coroutines/

用 tornado 作网站 (7)

转自：http://wiki.jikexueyuan.com/project/start-learning-python/309.html

用 tornado 作网站 (7)

相关概念

同步和异步

阻塞和非阻塞

tornado 的同步

异步设置

实践中的异步