一,模块概述html
nginx将各功能模块组织成一条链,当有请求到达的时候,请求依次通过这条链上的部分或者所有模块,进行处理。每一个模块实现特定的功能。例如,实现对请求解压缩的模块,实现SSI的模块,实现与上游服务器进行通信的模块,实现与FastCGI服务进行通信的模块。nginx
有两个模块比较特殊,他们居于nginx core和各功能模块的中间。这两个模块就是http模块和mail模块。这2个模块在nginx core之上实现了另一层抽象,处理与HTTP协议和email相关协议(SMTP/POP3/IMAP)有关的事件,而且确保这些事件能被以正确的顺序调用其余的一些功能模块。算法
目前HTTP协议是被实如今http模块中的,可是有可能未来被剥离到一个单独的模块中,以扩展nginx支持SPDY协议。后端
二,模块的分类服务器
nginx的模块根据其功能基本上能够分为如下几种类型:并发
event module: 搭建了独立于操做系统的事件处理机制的框架,及提供了各具体事件的处理。包括ngx_events_module, ngx_event_core_module和ngx_epoll_module等。nginx具体使用何种事件处理模块,这依赖于具体的操做系统和编译选项。负载均衡
phase handler: 此类型的模块也被直接称为handler模块。主要负责处理客户端请求并产生待响应内容,好比ngx_http_static_module模块,负责客户端的静态页面请求处理并将对应的磁盘文件准备为响应内容输出。框架
output filter: 也称为filter模块,主要是负责对输出的内容进行处理,能够对输出进行修改。例如,能够实现对输出的全部html页面增长预约义的footbar一类的工做,或者对输出的图片的URL进行替换之类的工做。dom
upstream: upstream模块实现反向代理的功能,将真正的请求转发到后端服务器上,并从后端服务器上读取响应,发回客户端。upstream模块是一种特殊的handler,只不过响应内容不是真正由本身产生的,而是从后端服务器上读取的。socket
load-balancer: 负载均衡模块,实现特定的算法,在众多的后端服务器中,选择一个服务器出来做为某个请求的转发服务器。
三,nginx的请求处理
nginx使用一个多进程模型来对外提供服务,其中一个master进程,多个worker进程。master进程负责管理nginx自己和其余worker进程。
全部实际上的业务处理逻辑都在worker进程。worker进程中有一个函数,执行无限循环,不断处理收到的来自客户端的请求,并进行处理,直到整个nginx服务被中止。
worker进程中,ngx_worker_process_cycle()函数就是这个无限循环的处理函数。在这个函数中,一个请求的简单处理流程以下:
#) 操做系统提供的机制(例如epoll, kqueue等)产生相关的事件。
#) 接收和处理这些事件,如是接受到数据,则产生更高层的request对象。
#) 处理request的header和body。
#) 产生响应,并发送回客户端。
#) 完成request的处理。
#) 从新初始化定时器及其余事件。
四,请求的处理流程
为了让你们更好的了解nginx中请求处理过程,咱们以HTTP Request为例,来作一下详细地说明。
从nginx的内部来看,一个HTTP Request的处理过程涉及到如下几个阶段。
#) 初始化HTTP Request(读取来自客户端的数据,生成HTTP Request对象,该对象含有该请求全部的信息)。
#) 处理请求头。
#) 处理请求体。
#) 若是有的话,调用与此请求(URL或者Location)关联的handler。
#) 依次调用各phase handler进行处理。
在这里,咱们须要了解一下phase handler这个概念。phase字面的意思,就是阶段。因此phase handlers也就好理解了,就是包含若干个处理阶段的一些handler。
在每个阶段,包含有若干个handler,再处理到某个阶段的时候,依次调用该阶段的handler对HTTP Request进行处理。
一般状况下,一个phase handler对这个request进行处理,并产生一些输出。一般phase handler是与定义在配置文件中的某个location相关联的。
一个phase handler一般执行如下几项任务:
#) 获取location配置。
#) 产生适当的响应。
#) 发送response header。
#) 发送response body。
当nginx读取到一个HTTP Request的header的时候,nginx首先查找与这个请求关联的虚拟主机的配置。若是找到了这个虚拟主机的配置,那么一般状况下,这个HTTP Request将会通过如下几个阶段的处理(phase handlers):
NGX_HTTP_POST_READ_PHASE: 读取请求内容阶段
NGX_HTTP_SERVER_REWRITE_PHASE: Server请求地址重写阶段
NGX_HTTP_FIND_CONFIG_PHASE: 配置查找阶段:
NGX_HTTP_REWRITE_PHASE: Location请求地址重写阶段
NGX_HTTP_POST_REWRITE_PHASE: 请求地址重写提交阶段
NGX_HTTP_PREACCESS_PHASE: 访问权限检查准备阶段
NGX_HTTP_ACCESS_PHASE: 访问权限检查阶段
NGX_HTTP_POST_ACCESS_PHASE: 访问权限检查提交阶段
NGX_HTTP_TRY_FILES_PHASE: 配置项try_files处理阶段
NGX_HTTP_CONTENT_PHASE: 内容产生阶段
NGX_HTTP_LOG_PHASE: 日志模块处理阶段
在内容产生阶段,为了给一个request产生正确的响应,nginx必须把这个request交给一个合适的content handler去处理。若是这个request对应的location在配置文件中被明确指定了一个content handler,那么nginx就能够经过对location的匹配,直接找到这个对应的handler,并把这个request交给这个content handler去处理。这样的配置指令包括像perl,flv,proxy_pass,mp4等。
若是一个request对应的location并无直接有配置的content handler,那么nginx依次尝试:
#) 若是一个location里面有配置random_index on,那么随机选择一个文件,发送给客户端。
#) 若是一个location里面有配置index指令,那么发送index指令指明的文件,给客户端。
#) 若是一个location里面有配置autoindex on,那么就发送请求地址对应的服务端路径下的文件列表给客户端。
#) 若是这个request对应的location上有设置gzip_static on,那么就查找是否有对应的.gz文件存在,有的话,就发送这个给客户端(客户端支持gzip的状况下)。
#) 请求的URI若是对应一个静态文件,static module就发送静态文件的内容到客户端。
内容产生阶段完成之后,生成的输出会被传递到filter模块去进行处理。filter模块也是与location相关的。全部的fiter模块都被组织成一条链。输出会依次穿越全部的filter,直到有一个filter模块的返回值代表已经处理完成。
这里列举几个常见的filter模块,例如:
#) server-side includes。
#) XSLT filtering。
#) 图像缩放之类的。
#) gzip压缩。
在全部的filter中,有几个filter模块须要关注一下。按照调用的顺序依次说明以下:
write: 写输出到客户端,其实是写到链接对应的socket上。 postpone: 这个filter是负责subrequest的,也就是子请求的。 copy: 将一些须要复制的buf(文件或者内存)从新复制一份而后交给剩余的body filter处理。