以前在网上看过一些介绍Django处理请求的流程和Django源码结构的文章,以为了解一下这些内容对开发Django项目仍是颇有帮助的。因此,我按照本身的逻辑总结了一下Django项目的运行方式和对Request的基本处理流程。python
1、Django的运行方式web
运行Django项目的方法不少,这里主要介绍一下经常使用的方法。一种是在开发和调试中常常用到runserver方法,使用Django本身的web server;另一种就是使用fastcgi,uWSGIt等协议运行Django项目,这里以uWSGIt为例。django
一、runserver方法浏览器
runserver方法是调试Django时常常用到的运行方式,它使用Django自带的WSGI Server运行,主要在测试和开发中使用,使用方法以下:bash
1
2
3
4
|
Usage: manage.py runserver [options] [optional port number, or ipaddr:port]
# python manager.py runserver # default port is 8000
# python manager.py runserver 8080
# python manager.py runserver 127.0.0.1:9090
|
看一下manager.py的源码,你会发现上面的命令实际上是经过Django的execute_from_command_line方法执行了内部实现的runserver命令,那么如今看一下runserver具体作了什么。服务器
看了源码以后,能够发现runserver命令主要作了两件事情:session
1). 解析参数,并经过django.core.servers.basehttp.get_internal_wsgi_application方法获取wsgi handler;app
2). 根据ip_address和port生成一个WSGIServer对象,接受用户请求框架
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
|
get_internal_wsgi_application的源码以下:
def get_internal_wsgi_application():
"""
Loads and returns the WSGI application as configured by the user in
``settings.WSGI_APPLICATION``. With the default ``startproject`` layout,
this will be the ``application`` object in ``projectname/wsgi.py``.
This function, and the ``WSGI_APPLICATION`` setting itself, are only useful
for Django's internal servers (runserver, runfcgi); external WSGI servers
should just be configured to point to the correct application object
directly.
If settings.WSGI_APPLICATION is not set (is ``None``), we just return
whatever ``django.core.wsgi.get_wsgi_application`` returns.
"""
from django.conf import settings
app_path = getattr (settings, 'WSGI_APPLICATION' )
if app_path is None :
return get_wsgi_application()
return import_by_path(
app_path,
error_prefix = "WSGI application '%s' could not be loaded; " % app_path
)
|
经过上面的代码咱们能够知道,Django会先根据settings中的WSGI_APPLICATION来获取handler;在建立project的时候,Django会默认建立一个wsgi.py文件,而settings中的WSGI_APPLICATION配置也会默认指向这个文件。看一下这个wsgi.py文件,其实它也和上面的逻辑同样,最终调用get_wsgi_application实现。socket
二、uWSGI方法
uWSGI+Nginx的方法是如今最多见的在生产环境中运行Django的方法,本人的博客也是使用这种方法运行,要了解这种方法,首先要了解一下WSGI和uWSGI协议。
WSGI,全称Web Server Gateway Interface,或者Python Web Server Gateway Interface,是为Python语言定义的Web服务器和Web应用程序或框架之间的一种简单而通用的接口,基于现存的CGI标准而设计的。WSGI其实就是一个网关(Gateway),其做用就是在协议之间进行转换。(PS: 这里只对WSGI作简单介绍,想要了解更多的内容可自行搜索)
uWSGI是一个Web服务器,它实现了WSGI协议、uwsgi、http等协议。注意uwsgi是一种通讯协议,而uWSGI是实现uwsgi协议和WSGI协议的Web服务器。uWSGI具备超快的性能、低内存占用和多app管理等优势。以个人博客为例,uWSGI的xml配置以下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
|
< uwsgi >
<!-- 端口 -->
< socket >:7600</ socket >
< stats >:40000</ stats >
<!-- 系统环境变量 -->
< env >DJANGO_SETTINGS_MODULE=geek_blog.settings</ env >
<!-- 指定的python WSGI模块 -->
< module >django.core.handlers.wsgi:WSGIHandler()</ module >
< processes >6</ processes >
< master />
< master-as-root />
<!-- 超时设置 -->
< harakiri >60</ harakiri >
< harakiri-verbose />
< daemonize >/var/app/log/blog/uwsgi.log</ daemonize >
<!-- socket的监听队列大小 -->
< listen >32768</ listen >
<!-- 内部超时时间 -->
< socket-timeout >60</ socket-timeout >
</ uwsgi >
|
以上就是uWSGI xml配置的写法,也可使用ini的方式。安装uWSGI和运行的命令以下:
1
2
|
sudo pip install uwsgi
uwsgi --pidfile= /var/run/geek-blog .pid -x uwsgi.xml --uid blog --gid nogroup
|
uWSGI和Nginx一块儿使用的配置方法就不在这里说明了,网上教程不少,须要的能够自行搜索。
2、HTTP请求处理流程
Django和其余Web框架同样,HTTP的处理流程基本相似:接受request,返回response内容。Django的具体处理流程大体以下图所示:
一、加载project settings
在经过django-admin.py建立project的时候,Django会自动生成默认的settings文件和manager.py等文件,在建立WSGIServer以前会执行下面的引用:
from django.conf import settings
上面引用在执行时,会读取os.environ中的DJANGO_SETTINGS_MODULE配置,加载项目配置文件,生成settings对象。因此,在manager.py文件中你能够看到,在获取WSGIServer以前,会先将project的settings路径加到os路径中。
二、建立WSGIServer
不论是使用runserver仍是uWSGI运行Django项目,在启动时都会调用django.core.servers.basehttp中的run()方法,建立一个django.core.servers.basehttp.WSGIServer类的实例,以后调用其serve_forever()方法启动HTTP服务。run方法的源码以下:
1
2
3
4
5
6
7
8
9
10
|
def run(addr, port, wsgi_handler, ipv6 = False , threading = False ):
server_address = (addr, port)
if threading:
httpd_cls = type ( str ( 'WSGIServer' ), (socketserver.ThreadingMixIn, WSGIServer), {})
else :
httpd_cls = WSGIServer
httpd = httpd_cls(server_address, WSGIRequestHandler, ipv6 = ipv6)
# Sets the callable application as the WSGI application that will receive requests
httpd.set_app(wsgi_handler)
httpd.serve_forever()
|
如上,咱们能够看到:在建立WSGIServer实例的时候会指定HTTP请求的Handler,上述代码使用WSGIRequestHandler。当用户的HTTP请求到达服务器时,WSGIServer会建立WSGIRequestHandler实例,使用其handler方法来处理HTTP请求(其实最终是调用wsgiref.handlers.BaseHandler中的run方法处理)。WSGIServer经过set_app方法设置一个可调用(callable)的对象做为application,上面提到的handler方法最终会调用设置的application处理request,并返回response。
其中,WSGIServer继承自wsgiref.simple_server.WSGIServer,而WSGIRequestHandler继承自wsgiref.simple_server.WSGIRequestHandler,wsgiref是Python标准库给出的WSGI的参考实现。其源码可自行到wsgiref参看,这里再也不细说。
三、处理Request
第二步中说到的application,在Django中通常是django.core.handlers.wsgi.WSGIHandler对象,WSGIHandler继承自django.core.handlers.base.BaseHandler,这个是Django处理request的核心逻辑,它会建立一个WSGIRequest实例,而WSGIRequest是从http.HttpRequest继承而来
四、返回Response
上面提到的BaseHandler中有个get_response方法,该方法会先加载Django项目的ROOT_URLCONF,而后根据url规则找到对应的view方法(类),view逻辑会根据request实例生成并返回具体的response。
在Django返回结果以后,第二步中提到wsgiref.handlers.BaseHandler.run方法会调用finish_response结束请求,并将内容返回给用户。
3、Django处理Request的详细流程
上述的第三步和第四步逻辑只是大体说了一下处理过程,Django在处理request的时候其实作了不少事情,下面咱们详细的过一下。首先给你们分享两个网上看到的Django流程图:
Django流程图1
Django流程图2
上面的两张流程图能够大体描述Django处理request的流程,按照流程图2的标注,能够分为如下几个步骤:
1. 用户经过浏览器请求一个页面
2. 请求到达Request Middlewares,中间件对request作一些预处理或者直接response请求
3. URLConf经过urls.py文件和请求的URL找到相应的View
4. View Middlewares被访问,它一样能够对request作一些处理或者直接返回response
5. 调用View中的函数
6. View中的方法能够选择性的经过Models访问底层的数据
7. 全部的Model-to-DB的交互都是经过manager完成的
8. 若是须要,Views可使用一个特殊的Context
9. Context被传给Template用来生成页面
a. Template使用Filters和Tags去渲染输出
b. 输出被返回到View
c. HTTPResponse被发送到Response Middlewares
d. 任何Response Middlewares均可以丰富response或者返回一个彻底不一样的response
e. Response返回到浏览器,呈现给用户
上述流程中最主要的几个部分分别是:Middleware(中间件,包括request, view, exception, response),URLConf(url映射关系),Template(模板系统),下面一一介绍一下。
一、Middleware(中间件)
Middleware并非Django所独有的东西,在其余的Web框架中也有这种概念。在Django中,Middleware能够渗入处理流程的四个阶段:request,view,response和exception,相应的,在每一个Middleware类中都有rocess_request,process_view, process_response 和 process_exception这四个方法。你能够定义其中任意一个活多个方法,这取决于你但愿该Middleware做用于哪一个处理阶段。每一个方法均可以直接返回response对象。
Middleware是在Django BaseHandler的load_middleware方法执行时加载的,加载以后会创建四个列表做为处理器的实例变量:
Django的中间件是在其配置文件(settings.py)的MIDDLEWARE_CLASSES元组中定义的。在MIDDLEWARE_CLASSES中,中间件组件用字符串表示:指向中间件类名的完整Python路径。例如GeekBlog项目的配置:
1
2
3
4
5
6
7
8
9
10
11
|
MIDDLEWARE_CLASSES = (
'django.middleware.cache.UpdateCacheMiddleware' ,
'django.middleware.common.CommonMiddleware' ,
'django.middleware.cache.FetchFromCacheMiddleware' ,
'django.contrib.sessions.middleware.SessionMiddleware' ,
'django.middleware.csrf.CsrfViewMiddleware' ,
'django.contrib.auth.middleware.AuthenticationMiddleware' ,
'django.contrib.messages.middleware.MessageMiddleware' ,
'django.middleware.locale.LocaleMiddleware' ,
'geek_blog.middlewares.MobileDetectionMiddleware' , # 自定义的Middleware
)
|
Django项目的安装并不强制要求任何中间件,若是你愿意,MIDDLEWARE_CLASSES能够为空。中间件出现的顺序很是重要:在request和view的处理阶段,Django按照MIDDLEWARE_CLASSES中出现的顺序来应用中间件,而在response和exception异常处理阶段,Django则按逆序来调用它们。也就是说,Django将MIDDLEWARE_CLASSES视为view函数外层的顺序包装子:在request阶段按顺序从上到下穿过,而在response则反过来。如下两张图能够更好地帮助你理解:
Django Middleware流程1
Django Middleware流程图2
二、URLConf(URL映射)
若是处理request的中间件都没有直接返回response,那么Django会去解析用户请求的URL。URLconf就是Django所支撑网站的目录。它的本质是URL模式以及要为该URL模式调用的视图函数之间的映射表。经过这种方式能够告诉Django,对于这个URL调用这段代码,对于那个URL调用那段代码。具体的,在Django项目的配置文件中有ROOT_URLCONF常量,这个常量加上根目录"/",做为参数来建立django.core.urlresolvers.RegexURLResolver的实例,而后经过它的resolve方法解析用户请求的URL,找到第一个匹配的view。
其余有关URLConf的内容,这里再也不具体介绍,你们能够看DjangoBook了解。
三、Template(模板)
大部分web框架都有本身的Template(模板)系统,Django也是。可是,Django模板不一样于Mako模板和jinja2模板,在Django模板不能直接写Python代码,只能经过额外的定义filter和template tag实现。因为本文主要介绍Django流程,模板内容就不过多介绍。
PS: 以上代码和内容都是基于Django 1.6.5版本,其余版本可能与其不一样,请参考阅读。