一篇文章搞懂Nginx

Nginx 的产生

Nginx 同 Apache 同样都是一种 Web 服务器。基于 REST 架构风格,以统一资源描述符(Uniform Resources Identifier)URI 或者统一资源定位符(Uniform Resources Locator)URL 做为沟通依据,经过 HTTP 协议提供各类网络服务。算法

然而,这些服务器在设计之初受到当时环境的局限,例如当时的用户规模,网络带宽,产品特色等局限而且各自的定位和发展都不尽相同。这也使得各个 Web 服务器有着各自鲜明的特色。后端

Apache 的发展时期很长,并且是毫无争议的世界第一大服务器。它有着不少优势:稳定、开源、跨平台等等。浏览器

它出现的时间太长了,它兴起的年代,互联网产业远远比不上如今。因此它被设计为一个重量级的。缓存

它不支持高并发的服务器。在 Apache 上运行数以万计的并发访问,会致使服务器消耗大量内存。安全

操做系统对其进行进程或线程间的切换也消耗了大量的 CPU 资源,致使 HTTP 请求的平均响应速度下降。服务器

这些都决定了 Apache 不可能成为高性能 Web 服务器,轻量级高并发服务器 Nginx 就应运而生了。网络

俄罗斯的工程师 Igor Sysoev,他在为 Rambler Media 工做期间,使用 C 语言开发了 Nginx。架构

Nginx 做为 Web 服务器一直为 Rambler Media 提供出色而又稳定的服务。而后呢,Igor Sysoev 将 Nginx 代码开源,而且赋予自由软件许可证。并发

因为如下这几点,因此,Nginx 火了:负载均衡

 

  • Nginx 使用基于事件驱动架构,使得其能够支持数以百万级别的 TCP 链接。

  • 高度的模块化和自由软件许可证使得第三方模块层出不穷(这是个开源的时代啊)。

  • Nginx 是一个跨平台服务器,能够运行在 Linux、Windows、FreeBSD、Solaris、AIX、Mac OS 等操做系统上。

  • 这些优秀的设计带来的极大的稳定性。

     

Nginx 的用武之地

 

Nginx 是一款自由的、开源的、高性能的 HTTP 服务器和反向代理服务器;同时也是一个 IMAP、POP三、SMTP 代理服务器。

 

Nginx 能够做为一个 HTTP 服务器进行网站的发布处理,另外 Nginx 能够做为反向代理进行负载均衡的实现。

 

关于代理

 

说到代理,首先咱们要明确一个概念,所谓代理就是一个表明、一个渠道;此时就涉及到两个角色,一个是被代理角色,一个是目标角色。

 

被代理角色经过这个代理访问目标角色完成一些任务的过程称为代理操做过程;如同生活中的专卖店,客人到 adidas 专卖店买了一双鞋,这个专卖店就是代理,被代理角色就是 adidas 厂家,目标角色就是用户。

 

正向代理

 

说反向代理以前,咱们先看看正向代理,正向代理也是你们最常接触到的代理模式,咱们会从两个方面来讲关于正向代理的处理模式,分别从软件方面和生活方面来解释一下什么叫正向代理。

 

在现在的网络环境下,咱们若是因为技术须要要去访问国外的某些网站,此时你会发现位于国外的某网站咱们经过浏览器是没有办法访问的。

 

此时你们可能都会用一个操做 FQ 进行访问,FQ 的方式主要是找到一个能够访问国外网站的代理服务器,咱们将请求发送给代理服务器,代理服务器去访问国外的网站,而后将访问到的数据传递给咱们!

 

上述这样的代理模式称为正向代理,正向代理最大的特色是客户端很是明确要访问的服务器地址;服务器只清楚请求来自哪一个代理服务器,而不清楚来自哪一个具体的客户端;正向代理模式屏蔽或者隐藏了真实客户端信息。

 

来看个示意图(我把客户端和正向代理框在一块,同属于一个环境,后面我有介绍):

 

 

客户端必须设置正向代理服务器,固然前提是要知道正向代理服务器的 IP 地址,还有代理程序的端口。

 

以下图:

 

总结来讲:正向代理,"它代理的是客户端",是一个位于客户端和原始服务器(Origin Server)之间的服务器,为了从原始服务器取得内容,客户端向代理发送一个请求并指定目标(原始服务器)。

 

而后代理向原始服务器转交请求并将得到的内容返回给客户端。客户端必需要进行一些特别的设置才能使用正向代理。

 

正向代理的用途:

 

  • 访问原来没法访问的资源,如 Google。

  • 能够作缓存,加速访问资源。

  • 对客户端访问受权,上网进行认证。

  • 代理能够记录用户访问记录(上网行为管理),对外隐藏用户信息。

 

反向代理

 

明白了什么是正向代理,咱们继续看关于反向代理的处理方式,举例如我国的某宝网站,天天同时链接到网站的访问人数已经爆表,单个服务器远远不能知足人民日益增加的购买欲望了。

 

此时就出现了一个你们耳熟能详的名词:分布式部署;也就是经过部署多台服务器来解决访问人数限制的问题。

 

某宝网站中大部分功能也是直接使用 Nginx 进行反向代理实现的,而且经过封装 Nginx 和其余的组件以后起了个高大上的名字:Tengine。

 

有兴趣的童鞋能够访问 Tengine 的官网查看具体的信息:

 

http://tengine.taobao.org/

 

 

那么反向代理具体是经过什么样的方式实现的分布式的集群操做呢,咱们先看一个示意图(我把服务器和反向代理框在一块,同属于一个环境,后面我有介绍):

 

经过上述的图解你们就能够看清楚了,多个客户端给服务器发送的请求,Nginx 服务器接收到以后,按照必定的规则分发给了后端的业务处理服务器进行处理了。

 

此时请求的来源也就是客户端是明确的,可是请求具体由哪台服务器处理的并不明确了,Nginx 扮演的就是一个反向代理角色。

 

客户端是无感知代理的存在的,反向代理对外都是透明的,访问者并不知道本身访问的是一个代理。由于客户端不须要任何配置就能够访问。

 

反向代理,"它代理的是服务端",主要用于服务器集群分布式部署的状况下,反向代理隐藏了服务器的信息。

 

反向代理的做用:

 

  • 保证内网的安全,一般将反向代理做为公网访问地址,Web 服务器是内网。

  • 负载均衡,经过反向代理服务器来优化网站的负载。

项目场景

 

一般状况下,咱们在实际项目操做时,正向代理和反向代理颇有可能会存在同一个应用场景中,正向代理代理客户端的请求去访问目标服务器,目标服务器是一个反向代理服务器,反向代理了多台真实的业务处理服务器。

 

具体的拓扑图以下:

截了一张图来讲明正向代理和反向代理两者之间的区别,以下图:

 

图解:

 

  • 在正向代理中,Proxy 和 Client 同属于一个 LAN(图中方框内),隐藏了客户端信息。

  • 在反向代理中,Proxy 和 Server 同属于一个 LAN(图中方框内),隐藏了服务端信息。

 

实际上,Proxy 在两种代理中作的事情都是替服务器代为收发请求和响应,不过从结构上看正好左右互换了一下,因此把后出现的那种代理方式称为反向代理了。

 

负载均衡

 

咱们已经明确了所谓代理服务器的概念,那么接下来,Nginx 扮演了反向代理服务器的角色,它是依据什么样的规则进行请求分发的呢?不用的项目应用场景,分发的规则是否能够控制呢?

 

这里提到的客户端发送的、Nginx 反向代理服务器接收到的请求数量,就是咱们说的负载量。

 

请求数量按照必定的规则进行分发,到不一样的服务器处理的规则,就是一种均衡规则。

 

因此将服务器接收到的请求按照规则分发的过程,称为负载均衡。

 

负载均衡在实际项目操做过程当中,有硬件负载均衡和软件负载均衡两种,硬件负载均衡也称为硬负载,如 F5 负载均衡,相对造价昂贵成本较高。

 

可是数据的稳定性安全性等等有很是好的保障,如中国移动中国联通这样的公司才会选择硬负载进行操做。

 

更多的公司考虑到成本缘由,会选择使用软件负载均衡,软件负载均衡是利用现有的技术结合主机硬件实现的一种消息队列分发机制。

 

Nginx 支持的负载均衡调度算法方式以下:

 

①weight 轮询(默认):接收到的请求按照顺序逐一分配到不一样的后端服务器,即便在使用过程当中,某一台后端服务器宕机,Nginx 会自动将该服务器剔除出队列,请求受理状况不会受到任何影响。

 

这种方式下,能够给不一样的后端服务器设置一个权重值(weight),用于调整不一样的服务器上请求的分配率。

 

权重数据越大,被分配到请求的概率越大;该权重值,主要是针对实际工做环境中不一样的后端服务器硬件配置进行调整的。

 

②ip_hash:每一个请求按照发起客户端的 ip 的 hash 结果进行匹配,这样的算法下一个固定 ip 地址的客户端总会访问到同一个后端服务器,这也在必定程度上解决了集群部署环境下 Session 共享的问题。

 

③fair:智能调整调度算法,动态的根据后端服务器的请求处理到响应的时间进行均衡分配。

 

响应时间短处理效率高的服务器分配到请求的几率高,响应时间长处理效率低的服务器分配到的请求少,它是结合了前二者的优势的一种调度算法。

 

可是须要注意的是 Nginx 默认不支持 fair 算法,若是要使用这种调度算法,请安装 upstream_fair 模块。

 

④url_hash:按照访问的 URL 的 hash 结果分配请求,每一个请求的 URL 会指向后端固定的某个服务器,能够在 Nginx 做为静态服务器的状况下提升缓存效率。

 

一样要注意 Nginx 默认不支持这种调度算法,要使用的话须要安装 Nginx 的 hash 软件包。

 

Web 服务器对比

 

几种经常使用 Web 服务器对好比下图: