- 简单地说,集群就是指一组(若干个)相互独立的计算机,利用高速通讯网络组成的一个较大的计算机服务系统,每一个集群节点(即集群中的每台计算机)都是运行各自服务的独立服务器。这些服务器之间能够彼此通讯,协同向用户提供应用程序,系统资源和数据,并以单一系统的模式加以管理。当用户客户机请求集群系统时,集群给用户的感受就是一个单一独立的服务器,而实际上用户请求的是一组集群服务器。
- 打开谷歌,百度的页面,看起来好简单,也许你以为用几分钟就能够制做出类似的网页,而实际上,这个页面的背后是由成千上万台服务器集群协同工做的结果。而这么多的服务器维护和管理,以及相互协调工做也许就是同窗们将来的工做职责了。
- 若要用一句话描述集群,即一堆服务器合做作同一件事,这些机器可能须要整个技术团队架构,设计和统一协调管理,这些机器能够分布在一个机房,也能够分布在全国全球各个地区的多个机房。
(1)高性能php
一些国家重要的计算密集型应用(如天气预报,核试验模拟等),须要计算机有很强的运算处理能力。以全世界现有的技术,即便是大型机,其计算能力也是有限的,很难单独完成此任务。由于计算时间可能会至关长,也许几天,甚至几年或更久。所以,对于这类复杂的计算业务,便使用了计算机集群技术,集中几十上百台,甚至成千上万台计算机进行计算。css
假如你配一个LNMP环境,每次只须要服务10个并发请求,那么单台服务器必定会比多个服务器集群要快。只有当并发或总请求数量超过单台服务器的承受能力时,服务器集群才会体现出优点。html
(2)价格有效性前端
- 一般一套系统集群架构,只须要几台或数十台服务器主机便可。与动辄价值上百万元的专用超级计算机相比便宜了不少。在达到一样性能需求的条件下,采用计算机集群架构比采用同等运算能力的大型计算机具备更高的性价比。
- 早期的淘宝,支付宝的数据库等核心系统就是使用上百万元的小型机服务器。后因使用维护成本过高以及扩展设备费用成几何级数翻倍,甚至成为扩展瓶颈,人员维护也十分困难,最终使用PC服务器集群替换之,好比,把数据库系统从小机结合Oracle数据库迁移到MySQL开源数据库结合PC服务器上来。不但成本降低了,扩展和维护也更容易了。
(3)可伸缩性java
当服务负载,压力增加时,针对集群系统进行较简单的扩展便可知足需求,且不会下降服务质量。linux
一般状况下,硬件设备若想扩展性能,不得不增长新的CPU和存储器设备,若是加不上去了,就不得不够买更高性能的服务器,就拿咱们如今的服务器来说,能够增长的设备老是有限的。若是采用集群技术,则只须要将新的单个服务器加入现有集群架构中便可,从访问的客户角度来看,系统服务不管是连续性仍是性能上都几乎没有变化,系统在不知不觉中完成了升级,加大了访问能力,轻松地实现了扩展。集群系统中的节点数目能够增加到几千乃至上万个,其伸缩性远超过单台超级计算机。android
(4)高可用性nginx
- 单一的计算机系统总会面临设备损毁的问题,如CPU,内存,主板,电源,硬盘等,只要一个部件坏掉,这个计算机系统就可能会宕机,没法正常提供服务。在集群系统中,尽管部分硬件和软件也仍是会发生故障,但整个系统的服务能够是7*24小时可用的。
(5)透明性git
多个独立计算机组成的松耦合集群系统构成一个虚拟服务器。用户或客户端程序访问集群系统时,就像访问一台高性能,高可用的服务器同样,集群中一部分服务器的上线,下线不会中断整个系统服务,这对用户也是透明的。github
(6)可管理性
整个系统可能在物理上很大,但其实容易管理,就像管理一个单一映像系统同样。在理想情况下,软硬件模块的插入能作到即插即用。
(7)可编程性
在集群系统上,容易开发及修改各种应用程序。
计算机集群架构按功能和结构能够分红如下几类:
提示:
负载均衡集群和高可用性集群是互联网行业经常使用的集群架构模式,也是咱们要学习的重点。
(1)负载均衡集群
-负载均衡集群为企业提供了更为实用,性价比更高的系统架构解决方案。负载均衡集群能够把不少客户集中的访问请求负载压力尽量平均地分摊在计算机集群中处理。客户访问请求负载一般包括应用程序处理负载和网络流量负载。这样的系统很是适合使用同一组应用程序为大量用户提供服务的模式,每一个节点均可以承担必定的访问请求负载压力,而且能够实现访问请求在各节点之间动态分配,以实现负载均衡。
-负载均衡集群运行时,通常是经过一个或多个前端负载均衡器将客户访问请求分发到后端的一组服务器上,从而达到整个系统的高性能和高可用性。通常高可用性集群和负载均衡集群会使用相似的技术,或同时具备高可用性与负载均衡的特色。
负载均衡集群的做用为:
负载均衡集群典型的开源软件包括LVS,Nginx,Haproxy等。以下图所示:
提示:
不一样的业务会有若干秒的切换时间,DB业务明显长于Web业务切换时间。
(2)高可用性集群
通常是指在集群中任意一个节点失效的状况下,该节点上的全部任务会自动转移到其余正常的节点上。此过程并不影响整个集群的运行。
- 当集群中的一个节点系统发生故障时,运行着的集群服务会迅速做出反应,将该系统的服务分配到集群中其余正在工做的系统上运行。考虑到计算机硬件和软件的容错性,高可用性集群的主要目的是使集群的总体服务尽量可用。若是高可用性集群中的主节点发生了故障,那么这段时间内将由备节点代替它。备节点一般是主节点的镜像。当它代替主节点时,它能够彻底接管主节点(包括IP地址及其余资源)提供服务,所以,使集群系统环境对于用户来讲是一致的,既不会影响用户的访问。
- 高可用性集群使服务器系统的运行速度和响应速度会尽量的快。他们常常利用在多台机器上运行的冗余节点和服务来相互跟踪。若是某个节点失败,它的替补者将在几秒钟或更短期内接管它的职责。所以,对于用户而言,集群里的任意一台机器宕机,业务都不会受影响(理论状况下)。
高可用性集群的做用为:
高可用性集群经常使用的开源软件包括Keepalived,Heartbeat等,其架构图以下图所示:
(3)高性能计算集群
高性能计算集群也称并行计算。一般,高性能计算集群涉及为集群开发的并行应用程序,以解决复杂的科学问题(天气预报,石油勘探,核反应模拟等)。高性能计算集群对外就好像一个超级计算机,这种超级计算机内部由数十至上万个独立服务器组成,而且在公共消息传递层上进行通讯以运行并行应用程序。在生产环境中实际就是把任务切成蛋糕,而后下发到集群节点计算,计算后返回结果,而后继续领新任务计算,如此往复。
(4)网格计算集群
因为不多用到,在此略
特别提示:
在互联网网站运维中,比较经常使用的就是负载均衡集群和高可用性集群
互联网企业经常使用的开源集群软件有:Nginx,LVS,Haproxy,Keepalived,heartbeat。
互联网企业经常使用的商业集群硬件有:F5,Netscaler,Radware,A10等,工做模式至关于Haproxy的工做模式。
淘宝,赶集网,新浪等公司曾使用过Netscaler负载均衡产品。集群硬件Netscaler的产品图以下图所示:
集群硬件F5产品以下图所示:
下面是我对同窗们的基本选择建议,更多的建议等你们学完负载均衡内容后再细分讲解。
相比较而言,商业的负载均衡产品成本高,性能好,更稳定,缺点是不能二次开发,开源的负载均衡软件对运维人员的能力要求较高,若是运维及开发能力强,那么开源的负载均衡软件是不错的选择,目前的互联网行业更倾向于使用开源的负载均衡软件。
- 中小企业互联网公司网站在并发访问和总访问量不是很大的状况下,建议首选Nginx负载均衡,理由是Nginx负载均衡配置简单,使用方便,安全稳定,社区活跃,使用的人逐渐增多,成为流行趋势,另一个实现负载均衡的相似产品为Haproxy(支持L4和L7负载,一样优秀,但社区不如Nginx活跃)。
- 若是要考虑Nginx负载均衡的高可用功能,建议首选Keepalived软件,理由是安装和配置简单,使用方便,安全稳定,与Keepalived服务相似的高可用软件还有Heartbeat(使用比较复杂,并不建议初学者使用)
- 若是是大型企业互联网公司,负载均衡产品可使用LVS+Keepalived在前端作四层转发(通常是主备或主主,若是须要扩展可使用DNS或前端使用OSPF),后端使用Nginx或者Haproxy作7层转发(能够扩展到百台),再后面是应用服务器,若是是数据库与存储的负载均衡和高可用,建议选择LVS+Heartbeat,LVS支持TCP转发且DR模式效率很高,Heartbeat能够配合drbd,不但能够进行VIP的切换,还能够支持块设备级别的数据同步(drbd),以及资源服务的管理。
负载均衡集群提供了一种廉价,有效,透明的方法,来扩展网络设备和服务器的负载,带宽和吞吐量,同时增强了网络数据处理能力,提升了网络的灵活性和可用性。
搭建负载均衡服务的需求以下:
(1)把单台计算机没法承受的大规模并发访问或数据流量分担到多台节点设备上,分别进行处理,减小用户等待响应的时间,提高用户体验。
(2)单个重负载的运算分担到多台节点设备上作并行处理,每一个节点设备处理结束后,将结果汇总,返回给用户,系统处理能力获得大幅度提升。
(3)7*24小时的服务保证,任意一个或多个有限后面节点设备宕机,不能影响业务。
在负载均衡集群中,同组集群的全部计算机节点都应该提供相同的服务。集群负载均衡器会截获全部对该服务的入站请求。而后将这些请求尽量地平均地分配在全部集群节点上。
(1)反向代理与负载均衡概念简介
- 严格地说,Nginx仅仅是做为Nginx Proxy反向代理使用的,由于这个反向代理功能表现的效果是负载均衡集群的效果,因此本文称之为Nginx负载均衡。那么,反向代理和负载均衡有什么区别呢?
- 普通负载均衡软件,例如大名鼎鼎的LVS,其实功能只是对请求数据包的转发(也可能会改写数据包),传递,其中DR模式明显的特征是从负载均衡下面的节点服务器来看,接收到的请求仍是来自访问负载均衡器的客户端的真实用户,而反向代理就不同了,反向代理接收访问用户的请求后,会代理用户从新发起请求代理下的节点服务器,最后把数据返回给客户端用户,在节点服务器看来,访问的节点服务器的客户端用户就是反向代理服务器了,而非真实的网站访问用户。
- 一句话,LVS等的负载均衡是转发用户请求的数据包,而Nginx反向代理是接收用户的请求而后从新发起请求去请求其后面的节点。
(2)实现Nginx负载均衡的组件说明
实现Nginx负载均衡的组件主要有两个,以下表:
本节先带同窗们一块儿操做实战,让同窗们对Nginx负载均衡有一个初步的概念,而后再继续深刻讲解Nginx负载均衡的核心知识应用。
上图是快速实践Nginx负载均衡的逻辑架构图
在上图中,全部用户的请求统一发送到Nginx负载均衡器,而后由负载均衡器根据调度算法来请求Web01和Web02
(1)硬件准备
准备4台VM虚拟机(有物理服务器更佳),两台作负载均衡,两台作RS,以下表:
HOSTNAME | IP | 说明 |
---|---|---|
lb01 | 192.168.0.221 | Nginx主负载均衡器 |
lb02 | 192.168.0.222 | Nginx副负载均衡器 |
web01 | 192.168.0.223 | Web01服务器 |
web02 | 192.168.0.224 | Web02服务器 |
(2)软件准备
系统:CentOS6.5 x86_64
软件:nginx-1.10.2.tar.gz
下面将在以上4台服务器上安装Nginx,这里只给出安装的命令部分。
(1)安装依赖软件包命令集合。
[root@localhost ~]# yum -y install openssl openssl-devel pcre pcre-devel [root@localhost ~]# rpm -qa openssl openssl-devel pcre pcre-devel
(2)安装Nginx软件包命令集合
[root@localhost ~]# tar xf nginx-1.10.2.tar.gz -C /usr/src/ [root@localhost ~]# cd /usr/src/nginx-1.10.2/ [root@localhost nginx-1.10.2]# useradd -M -s /sbin/nologin nginx [root@localhost nginx-1.10.2]# ./configure --user=nginx --group=nginx --prefix=/usr/local/nginx --with-http_stub_status_module --with-http_ssl_module && make && make install [root@localhost nginx]# ln -s /usr/local/nginx/sbin/* /usr/local/sbin/
本小节将在两台NginxWeb服务器的节点上操做:配置并查看Web服务器的配置结果。
[root@localhost nginx]# cat conf/nginx.conf worker_processes 1; events { worker_connections 1024; } http { include mime.types; default_type application/octet-stream; sendfile on; keepalive_timeout 65; log_format main '$remote_addr-$remote_user[$time_local]"$request"' '$status $body_bytes_sent "$http_referer"' '"$http_user_agent""$http_x_forwarded_for"'; server { listen 80; server_name bbs.yunjisuan.com; location / { root html/bbs; index index.html index.htm; } access_log logs/access_bbs.log main; } server { listen 80; server_name www.yunjisuan.com; location / { root html/www; index index.html index.htm; } access_log logs/access_www.log main; } } #提示: 这里故意将www虚拟主机放在下面,便于用后面的参数配置测试效果
配置完成后检查语法,并启动Nginx服务
[root@localhost nginx]# /usr/local/nginx/sbin/nginx [root@localhost nginx]# netstat -antup | grep nginx tcp 0 0 0.0.0.0:80 0.0.0.0:* LISTEN 4100/nginx
而后填充测试文件数据,以下:
[root@localhost nginx]# mkdir /usr/local/nginx/html/{www,bbs} [root@localhost nginx]# echo "`hostname -I `www" >> /usr/local/nginx/html/www/index.html [root@localhost nginx]# cat /usr/local/nginx/html/www/index.html 192.168.0.223 www [root@localhost nginx]# echo "`hostname -I `bbs" >> /usr/local/nginx/html/bbs/index.html [root@localhost nginx]# cat /usr/local/nginx/html/bbs/index.html 192.168.0.223 bbs #提示: 以上操做命令,在Web01上和Web02上是同样的
配置解析Web01的IP和主机名后,用curl测试一下
[root@localhost nginx]# tail -2 /etc/hosts 192.168.0.223 www.yunjisuan.com 192.168.0.223 bbs.yunjisuan.com [root@localhost nginx]# curl www.yunjisuan.com 192.168.0.223 www [root@localhost nginx]# curl bbs.yunjisuan.com 192.168.0.223 bbs
配置解析Web02的IP和主机名后,用curl测试一下
[root@localhost nginx]# vim /etc/hosts [root@localhost nginx]# tail -2 /etc/hosts 192.168.0.224 www.yunjisuan.com 192.168.0.224 bbs.yunjisuan.com [root@localhost nginx]# curl www.yunjisuan.com 192.168.0.224 www [root@localhost nginx]# curl bbs.yunjisuan.com 192.168.0.224 bbs
提示:
(1)不一样Web测试节点,返回的结果是不一样的,这是为了方便测试演示!
(2)经过上面配置就实现了两台Web服务器基于域名的虚拟主机配置。
本小节将在nginx lb01服务器节点操做(lb02和lb01相同,后文配置负载均衡器高可用时会用到lb02),其准备信息下表。
HOSTNAME | IP | 说明 |
---|---|---|
lb01 | 192.168.0.221 | Nginx主负载均衡器 |
下面进行一个简单的Nginx负载均衡配置,代理www.yunjisuan.com服务,节点为Web01和Web02.nginx.conf配置文件内容以下:
[root@lb01 nginx]# cat conf/nginx.conf worker_processes 1; events { worker_connections 1024; } http { include mime.types; default_type application/octet-stream; sendfile on; keepalive_timeout 65; upstream www_server_pools { #这里定义Web服务器池,包含了223,224两个Web节点 server 192.168.0.223:80 weight=1; server 192.168.0.224:80 weight=1; } server { #这里定义代理的负载均衡域名虚拟主机 listen 80; server_name www.yunjisuan.com; location / { proxy_pass http://www_server_pools; #访问www.yunjisuan.com,请求发送给www_server_pools里面的节点 } } }
如今检查语法并启动。命令以下:
[root@lb01 nginx]# nginx -t nginx: the configuration file /usr/local/nginx/conf/nginx.conf syntax is ok nginx: configuration file /usr/local/nginx/conf/nginx.conf test is successful [root@lb01 nginx]# /usr/local/nginx/sbin/nginx [root@lb01 nginx]# netstat -antup | grep nginx tcp 0 0 0.0.0.0:80 0.0.0.0:* LISTEN 4105/nginx
而后,检查负载均衡测试结果。Linux做为客户端的测试结果以下:
[root@lb01 nginx]# hostname -I 192.168.0.221 [root@lb01 nginx]# tail -1 /etc/hosts 192.168.0.221 www.yunjisuan.com #这里是lb1负载均衡器IP [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.223 bbs [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.224 bbs [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.223 bbs [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.224 bbs [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.223 bbs [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.224 bbs [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.223 bbs [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.224 bbs
从上面的测试结果能够看出来。两个Web节点按照1:1的比例被访问。
下面宕掉任意一个Web节点,看看测试结果如何,测试以下:
[root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.223 bbs [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.223 bbs [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.223 bbs [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.223 bbs [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.223 bbs
能够看到,网站业务不受影响,访问请求都定位到了正常的节点上。
如今,宕掉全部Web节点,此时,访问测试结果以下:
root@lb01 nginx]# curl www.yunjisuan.com <html> <head><title>502 Bad Gateway</title></head> <body bgcolor="white"> <center><h1>502 Bad Gateway</h1></center> <hr><center>nginx/1.10.2</center> </body> </html> [root@lb01 nginx]# curl www.yunjisuan.com <html> <head><title>502 Bad Gateway</title></head> <body bgcolor="white"> <center><h1>502 Bad Gateway</h1></center> <hr><center>nginx/1.10.2</center> </body> </html> [root@lb01 nginx]# curl www.yunjisuan.com <html> <head><title>502 Bad Gateway</title></head> <body bgcolor="white"> <center><h1>502 Bad Gateway</h1></center> <hr><center>nginx/1.10.2</center> </body> </html>
能够看到,Nginx代理下面没有节点了,所以,Nginx向用户报告了502错误。若是同时开启全部的Web服务又会怎样?测试结果以下:
[root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.223 bbs [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.224 bbs [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.223 bbs [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.224 bbs [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.223 bbs [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.224 bbs
结果是Nginx又把请求一比一分配到了Nginx后面的节点上。
同窗们感受如何?Nginx的负载均衡很简单吧?嗯,就是这么容易。
- Nginx的负载均衡功能依赖于ngx_http_upsteam_module模块,所支持的代理方式包括proxy_pass,fastcgi_pass,memcached_pass等,新版Nginx软件支持的方式有所增长。本文主要讲解proxy_pass代理方式。
- ngx_http_upstream_module模块容许Nginx定义一组或多组节点服务器组,使用时能够经过proxy_pass代理方式把网站的请求发送到事先定义好的对应Upstream组的名字上,具体写法为“proxy_pass http:// www_server_pools”,其中www_server_pools就是一个Upstream节点服务器组名字。ngx_http_upstream_module模块官方地址为:http://nginx.org/en/docs/http/ngx_http_upstream_module.html
upstream模块的语法至关简单,这里直接上范例给同窗们讲。
范例1:基本的upstream配置案例
upstream www_server_pools { # upstream是关键字必须有,后面的www_server_pools为一个Upstream集群组的名字,能够本身起名,调用时就用这个名字 server 192.168.0.223:80 weight=5; server 192.168.0.224:80 weight=10; server 192.168.0.225:80 weight=15; # server关键字是固定的,后面能够接域名(门户会用)或IP。若是不指定端口,默认是80端口。weight表明权重,数值越大被分配的请求越多,结尾有分号,别忘了。 }
范例2:较完整的upstream配置案例
upstream blog_server_pool { server 192.168.0.223; #这行标签和下行是等价的 server 192.168.0.224:80 weight=1 max_fails=1 fail_timeout=10s; #这行标签和上一行是等价的,此行多余的部分就是默认配置,不写也能够。 server 192.168.0.225:80 weight=1 max_fails=2 fail_timeout=20s backup; # server最后面能够加不少参数,具体参数做用看下文的表格 }
范例3:使用域名及socket的upstream配置案例
upstream backend { server backend1.example.com weight=5; server backend2.example.com:8080; #域名加端口。转发到后端的指定端口上 server unix:/tmp/backend3; #指定socket文件 #提示:server后面若是接域名,须要内网有DNS服务器或者在负载均衡器的hosts文件作域名解析。 server 192.168.0.223; server 192.168.0.224:8080; server backup1.example.com:8080 backup; #备份服务器,等上面指定的服务器都不可访问的时候会启动,backup的用法和Haproxy中用法同样 server backup2.example.com:8080 backup; }
若是是两台Web服务器作高可用,常规方案就须要keepalived配合,那么这里使用Nginx的backup参数经过负载均衡功能就能够实现Web服务器集群了,对于企业应用来讲,能作集群就不作高可用。
upstream模块的内容应放于nginx.conf配置的http{}标签内,其默认调度节点算法是wrr(weighted round-robin,即权重轮询)。下图为upstream模块内部server标签部分参数说明
提示:
以上参数与专业的Haproxy参数很相似,但不如Haproxy的参数易懂。
来看个示例,以下:
upstream backend { server backend1.example.com weight=5; #若是就是单个Server,不必设置权重 server 127.0.0.1:8080 max_fail=5 fail_timeout=10s; #当检测次数等于5的时候,5次连续检测失败后,间隔10s再从新检测。 server unix:/tmp/backend3; server backup1.example.com:8080 backup; #热备机器设置 }
须要特别说明的是,若是是Nginx代理Cache服务,可能须要使用hash算法,此时若宕机,可经过设置down参数确保客户端用户按照当前的hash算法访问,这一点很重要。示例配置以下:
upstream backend { ip_hash; server backend1.example.com; server backend2.example.com; server backend3.example.com down; server backend4.example.com; }
下面是Haproxy负载均衡器server标签的配置示例。
#开启对后端服务器的健康检测,经过GET /test/index.php来判断后端服务器的健康状况 server php_server_1 192.168.0.223:80 cookie 1 check inter 2000 rise 3 fall 3 weight 2 server php_server_2 192.168.0.224:80 cookie 2 check inter 2000 rise 3 fall 3 weight 1 server php_server_bak 192.168.0.225:80 cookie 3 check inter 1500 rise 3 fall 3 backup
上述命令的说明以下:
- weight:调节服务器的请求分配权重。
- check:开启对该服务器健康检查。
- inter:设置连续两次的健康检查间隔时间,单位毫秒,默认值2000
- rise:指定多少次连续成功的健康检查后,便可认定该服务器处于可用状态。
- fall:指定多少次不成功的健康检查后,即认为服务器为宕机状态,默认值3.
- maxconn:指定可被发送到该服务器的最大并发链接数。
调度算法通常分为两类:
第一类为静态调度算法,即负载均衡器根据自身设定的规则进行分配,不须要考虑后端节点服务器的状况,例如:rr,wrr,ip_hash等都属于静态调度算法。
第二类为动态调度算法,即负载均衡器会根据后端节点的当前状态来决定是否分发请求,例如:链接数少的优先得到请求,响应时间短的优先得到请求。例如:least_conn,fair等都属于动态调度算法。
下面介绍一下常见的调度算法。
(1) rr轮询(默认调度算法,静态调度算法)
按客户端请求顺序把客户端的请求逐一分配到不一样的后端节点服务器,这至关于LVS中的rr算法,若是后端节点服务器宕机(默认状况下Nginx只检测80端口),宕机的服务器会被自动从节点服务器池中剔除,以使客户端的用户访问不受影响。新的请求会分配给正常的服务器。
(2)wrr(权重轮询,静态调度算法)
在rr轮询算法的基础上加上权重,即为权重轮询算法,当使用该算法时,权重和用户访问成正比,权重值越大,被转发的请求也就越多。能够根据服务器的配置和性能指定权重值大小,有效解决新旧服务器性能不均带来的请求分配问题。
(3)ip_hash(静态调度算法)(会话保持)
每一个请求按客户端IP的hash结果分配,当新的请求到达时,先将其客户端IP经过哈希算法哈希出一个值,在随后的客户端请求中,客户IP的哈希值只要相同,就会被分配至同一台服务器,该调度算法能够解决动态网页的session共享问题,但有时会致使请求分配不均,即没法保证1:1的负载均衡,由于在国内大多数公司都是NAT上网模式,多个客户端会对应一个外部IP,因此,这些客户端都会被分配到同一节点服务器,从而致使请求分配不均。LVS负载均衡的-p参数,Keepalived配置里的persistence_timeout 50参数都相似这个Nginx里的ip_hash参数,其功能均可以解决动态网页的session共享问题。
咱们来看一个示例,以下:
upstream yunjisuan_lb{ ip_hash; server 192.168.0.223:80; server 192.168.0.224:8080; } upstream backend{ ip_hash; server backend1.example.com; server backend2.example.com; server backend3.example.com down; server backend4.example.com; }
注意:
当负载调度算法为ip_hash时,后端服务器在负载均衡调度中的状态不能有weight和backup,即便有也不会生效。
(4)fair(动态调度算法)
此算法会根据后端节点服务器的响应时间来分配请求,响应时间短的优先分配。这是更加智能的调度算法。此种算法能够根据页面大小和加载时间长短智能地进行负载均衡,也就是根据后端服务器的响应时间来分配请求,响应时间短的优先分配。Nginx自己不支持fair调度算法,若是须要使用这种调度算法,必须下载Nginx相关模块upstream_fair。
示例以下:
upstream yunjisuan_lb{ server 192.168.0.223; server 192.168.0.224; fair; }
(5)least_conn
least_conn算法会根据后端节点的链接数来决定分配状况,哪一个机器链接数少就分发。
除了上面介绍的这些算法外,还有一些第三方调度算法,例如:url_hash,一致性hash算法等,介绍以下。
(6)url_hash算法(web缓存节点)
- 与ip_hash相似,这里是根据访问URL的hash结果来分配请求的,让每一个URL定向到同一个后端服务器,后端服务器为缓存服务器时效果显著。在upstream中加入hash语句,server语句中不能写入weight等其余的参数,hash_method使用的是hash算法。
url_hash按访问URL的hash结果来分配请求,使每一个URL定向到同一个后端服务器,能够进一步提升后端缓存服务器的效率命令率。Nginx自己是不支持url_hash的,若是须要使用这种调度算法,必须安装Nginx的hash模块软件包。
url_hash(web缓存节点)和ip_hash(会话保持)相似。示例配置以下:
upstream yunjisuan_lb { server squid1:3128; server squid2:3128; hash $request_uri; hash_method crc32; }
(7)一致性hash算法
一致性hash算法通常用于代理后端业务为缓存服务(如Squid,Memcached)的场景,经过将用户请求的URI或者指定字符串进行计算,而后调度到后端的服务器上,此后任何用户查找同一个URI或者指定字符串都会被调度到这一台服务器上,所以后端的每一个节点缓存的内容都是不一样的,一致性hash算法能够解决后端某个或几个节点宕机后,缓存的数据动荡最小,一致性hash算法知识比较复杂,详细内容能够参考百度上的相关资料,这里仅仅给出配置示例:
http { upstream test { consistent_hash $request_uri; server 127.0.0.1:9001 id=1001 weight=3; server 127.0.0.1:9002 id=1002 weight=10; server 127.0.0.1:9003 id=1003 weight=20; } }
虽然Nginx自己不支持一致性hash算法,但Nginx得分支Tengine支持。详细可参考http://tengine.taobao.org/document_cn/http_upstream_consistent_hash_cn.html
proxy_pass指令属于ngx_http_proxy_module模块,此模块能够将请求转发到另外一台服务器,在实际的反向代理工做中,会经过location功能匹配指定的URI,而后把接收到的符合匹配URI的请求经过proxy_pass抛给定义好的upstream节点池。该指令官方地址1见:http://nginx.org/en/docs/http/ngx_http_proxy_module.html#proxy_pass
下面proxy_pass的使用案例:
(1)将匹配URI为name的请求抛给http://127.0.0.1/remote/.
location /name/ { proxy_pass http://127.0.0.1/remote/; }
(2)将匹配URI为some/path的请求抛给http://127.0.0.1
location /some/path/ { proxy_pass http://127.0.0.1; }
(3)将匹配URI为name的请求应用指定的rewrite规则,而后抛给http://127.0.0.1
location /name/ { rewrite /name/( [^/]+ ) /username=$1 break; proxy_pass http://127.0.0.1; }
Nginx的代理功能是经过http proxy模块来实现的。默认在安装Nginx时已经安装了http proxy模块,所以可直接使用http proxy模块。下面详细解释模块1中每一个选项表明的含义,见下表:
主机名 | IP地址 | 角色说明 |
---|---|---|
lb01 | 192.168.0.221 | nginx主负载均衡 |
lb02 | 192.168.0.222 | nginx从负载均衡 |
Web01 | 192.168.0.223 | nginx web01服务器 |
Web02 | 192.168.0.224 | nginx web02服务器 |
[root@lb01 nginx]# cat /usr/local/nginx/conf/nginx.conf worker_processes 1; events { worker_connections 1024; } http { include mime.types; default_type application/octet-stream; sendfile on; keepalive_timeout 65; upstream www_server_pools { #默认调度算法wrr,即权重轮询算法 #虽然定义的www服务器池可是这个服务器池也能够做为BBS等业务的服务器池。由于节点服务器的虚拟主机都是根据访问的主机头字段区分的。 server 192.168.0.223:80 weight=1; server 192.168.0.224:80 weight=1; } server { listen 80; server_name www.yunjisuan.com; location / { proxy_pass http://www_server_pools; #经过proxy_pass功能把用过户的请求交给上面反向代理upstream定义的www_server_pools服务器池处理。 } } }
如今配置hosts解析到代理服务器lb01上,从新加载服务,访问测试:
[root@lb01 nginx]# tail -2 /etc/hosts 192.168.0.221 www.yunjisuan.com 192.168.0.221 bbs.yunjisuan.com [root@lb01 nginx]# /usr/local/nginx/sbin/nginx -s reload [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.223 bbs [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.224 bbs
从测试结果能够看出,已经实现了反向代理,负载均衡功能,可是有一个特殊问题,出来的结果并非带有www的字符串,而是bbs的字符串,根据访问结果,咱们推测是访问了Web节点下bbs的虚拟主机,明明代理的是www虚拟主机,为何结果是访问了后端的bbs虚拟主机了呢?问题又该如何解决?请同窗们继续往下看。
上一节代理的结果不对,究其缘由是当用户访问域名时确实是携带了www.yunjisuan.com主机头请求Nginx反向代理服务器,可是反向代理向下面节点从新发起请求时,默认并无在请求头里告诉节点服务器要找哪台虚拟主机,因此,Web节点服务器接收到请求后发现没有主机头信息,所以,就把节点服务器的第一个虚拟主机发给了反向代理了(节点上第一个虚拟主机放置的是故意这样放置的bbs)。解决这个问题的方法,就是当反向代理向后从新发起请求时,要携带主机头信息,以明确告诉节点服务器要找哪一个虚拟主机。具体的配置很简单,就是在Nginx代理www服务虚拟主机配置里增长以下一行配置便可:
proxy_set_header host $host;
在代理向后端服务器发送的http请求头中加入host字段信息后,若后端服务器配置有多个虚拟主机,它就能够识别代理的是哪一个虚拟主机。这是节点服务器多虚拟主机时的关键配置。整个Nginx代理配置为:
[root@lb01 nginx]# cat /usr/local/nginx/conf/nginx.conf worker_processes 1; events { worker_connections 1024; } http { include mime.types; default_type application/octet-stream; sendfile on; keepalive_timeout 65; upstream www_server_pools { server 192.168.0.223:80 weight=1; server 192.168.0.224:80 weight=1; } server { listen 80; server_name www.yunjisuan.com; location / { proxy_pass http://www_server_pools; proxy_set_header host $host; #在代理向后端服务器发送的http请求头中加入host字段信息,用于当后端服务器配置有多个虚拟主机时,能够识别代理的是哪一个虚拟主机。这是节点服务器多虚拟主机时的关键配置。 } } }
此时,再从新加载Nginx服务,并用curl测试检查,结果以下:
[root@lb01 nginx]# /usr/local/nginx/sbin/nginx -s reload [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.223 www [root@lb01 nginx]# curl www.yunjisuan.com 192.168.0.224 www
能够看到此次访问的结果和访问的域名就彻底对应上了,这样代理多虚拟主机的节点服务器就不会出问题了
完成了反向代理WWW服务后,天然很开心,可是,不久后你用其余客户端做为客户端测试时,就会发现一个问题,节点服务器对应的WWW虚拟主机的访问日志的第一个字段记录的并非客户端的IP,而是反向代理服务器的IP,最后一个字段也是“-”!
例如:使用任意windows客户端计算机,访问已经解析好代理IP的www.yunjisuan.com后,去节点服务器www服务日志查看,就会发现以下日志:
[root@web01 ~]# tail -2 /usr/local/nginx/logs/access_www.log 192.168.0.221--[27/Jul/2017:04:05:22 -0400]"GET / HTTP/1.0"200 18 "-""curl/7.19.7 (x86_64-redhat-linux-gnu) libcurl/7.19.7 NSS/3.14.0.0 zlib/1.2.3 libidn/1.18 libssh2/1.4.2""-" 192.168.0.221--[27/Jul/2017:04:33:06 -0400]"GET / HTTP/1.0"200 18 "-""curl/7.19.7 (x86_64-redhat-linux-gnu) libcurl/7.19.7 NSS/3.14.0.0 zlib/1.2.3 libidn/1.18 libssh2/1.4.2""-"
Web01节点服务器对应的WWW虚拟主机的访问日志的第一个字段记录的并非客户端的IP而是反向代理服务器自己的IP(192.168.0.221),最后一个字段也是一个“-”,那么如何解决这个问题?其实很简单,一样是增长以下一行参数:
proxy_set_header X-Forwarded-For $remote_addr; #这是反向代理时,节点服务器获取用户真实IP的必要功能配置
在反向代理请求后端节点服务器的请求头中增长获取的客户端IP的字段信息,而后节点后端能够经过程序或者相关的配置接收X-Forwarded-For传过来的用户真实IP的信息。
解决上述问题的整个Nginx代理配置为:
[root@lb01 nginx]# cat /usr/local/nginx/conf/nginx.conf worker_processes 1; events { worker_connections 1024; } http { include mime.types; default_type application/octet-stream; sendfile on; keepalive_timeout 65; upstream www_server_pools { server 192.168.0.223:80 weight=1; server 192.168.0.224:80 weight=1; } server { listen 80; server_name www.yunjisuan.com; location / { proxy_pass http://www_server_pools; proxy_set_header host $host; proxy_set_header X-Forwarded-For $remote_addr; #在代理向后端服务器发送的http请求头中加入X-Forwarded-For字段信息,用于后端服务器程序,日志等接收记录真实用户的IP,而不是代理服务器的IP } } }
从新加载Nginx反向代理服务:
[root@lb01 nginx]# /usr/local/nginx/sbin/nginx -s reload
特别注意,虽然反向代理已经配好了,可是节点服务器须要的访问日志若是要记录用户的真实IP,还必须进行日志格式配置,这样才能把代理传过来的X-Forwarded-For头信息记录下来,具体配置为:
[root@web01 ~]# cat /usr/local/nginx/conf/nginx.conf worker_processes 1; events { worker_connections 1024; } http { include mime.types; default_type application/octet-stream; sendfile on; keepalive_timeout 65; log_format main '$remote_addr-$remote_user[$time_local]"$request"' '$status $body_bytes_sent "$http_referer"' '"$http_user_agent""$http_x_forwarded_for"'; #就是这里的“$http_x_forwarded_for”参数,若是但愿在第一行显示,能够替换掉第一行的$remote_addr变量。 server { listen 80; server_name bbs.yunjisuan.com; location / { root html/bbs; index index.html index.htm; } access_log logs/access_bbs.log main; } server { listen 80; server_name www.yunjisuan.com; location / { root html/www; index index.html index.htm; } access_log logs/access_www.log main; } } #注意:这里是客户端Web01的配置
完成Web01,Web02节点服务器的日志配置后,就能够检查了,注意,不要用curl从反向代理上检查,最好换一个客户端检查,这样才能看到效果。这里使用Windows客户端计算机(IP为192.168.0.110)访问已经解析好代理IP的www.yunjisuan.com,以下图所示:
此时,再去节点服务器WWW服务的访问日志里查看,会发现日志的结尾已经变化了:
[root@web01 ~]# tail -2 /usr/local/nginx/logs/access_www.log 192.168.0.221--[27/Jul/2017:05:11:22 -0400]"GET / HTTP/1.0"200 18 "-""Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 10.0; WOW64; Trident/7.0; .NET4.0C; .NET4.0E; .NET CLR 2.0.50727; .NET CLR 3.0.30729; .NET CLR 3.5.30729)""192.168.0.110" 192.168.0.221--[27/Jul/2017:05:11:23 -0400]"GET / HTTP/1.0"200 18 "-""Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 10.0; WOW64; Trident/7.0; .NET4.0C; .NET4.0E; .NET CLR 2.0.50727; .NET CLR 3.0.30729; .NET CLR 3.5.30729)""192.168.0.110"
其中,日志里的192.168.0.221为反向代理的IP,对应Nginx日志格式里的$remote_addr变量,而日志结尾的192.168.0.110对应的时日志格式里的“$http_x_forwarded_for”变量,即接收了前面反向代理配置中“proxy_set_header X-Forwarded-For $remote_addr;”参数X-Forwarded-For的IP了。
关于X-Forwarded-For的详细说明,可见http://en.wikipedia.org/wiki/X-Forwwawrded-For。下图是反向代理相关重要基础参数的总结,供同窗们参考。
除了具备多虚拟主机代理以及节点服务器记录真实用户IP的功能外,Nginx软件还提供了至关多的做为反向代理和后端节点服务器对话的相关控制参数,具体见前面在讲解proxy模块时提供的图表。
相信同窗们对这些参数有了必定了解了,因为参数众多,最好把这些参数放到一个配置文件里,而后用include方式包含到虚拟主机配置里,效果以下:
[root@lb01 conf]# cat /usr/local/nginx/conf/nginx.conf worker_processes 1; events { worker_connections 1024; } http { include mime.types; default_type application/octet-stream; sendfile on; keepalive_timeout 65; upstream www_server_pools { server 192.168.0.223:80 weight=1; server 192.168.0.224:80 weight=1; } server { listen 80; server_name www.yunjisuan.com; location / { proxy_pass http://www_server_pools; include proxy.conf; #这就是包含的配置,具体配置内容见下文 } } } [root@lb01 conf]# cat proxy.conf proxy_set_header host $host; proxy_set_header x-forwarded-for $remote_addr; proxy_connect_timeout 60; proxy_send_timeout 60; proxy_read_timeout 60; proxy_buffer_size 4k; proxy_buffers 4 32k; proxy_busy_buffers_size 64k; proxy_temp_file_write_size 64k;
更多Nginx反向代理参数说明:
http://nginx.org/en/docs/http/ngx_http_proxy_module.html
为了让同窗们能学以至用。仍是经过真实的企业案例模拟来给你们讲解这部分的知识
案例背景:
经过Nginx实现动静分离,即经过Nginx反向代理配置规则实现让动态资源和静态资源及其余业务分别由不一样的服务器解析,以解决网站性能,安全,用户体验等重要问题。
下图为企业常见的动静分离集群架构图,此架构图适合网站前端只使用同一个域名提供服务的场景,例如,用户访问的域名是www.yunjisuan.com,而后,当用户请求www.yunjisuan.com/upload/xx地址时候,代理会分配请求到上传服务器池处理数据;当用户请求www.yunjisuan.com/static/xx地址的时候,代理会分配请求到静态服务器池请求数据;当用户请求www.yunjisuan.com/xx地址的时候,即不包含上述指定的目录地址路径时,代理会分配请求到默认的动态服务器池请求数据(注意:上面的xx表示任意路径)。
先进行企业案例需求梳理:
了解了需求后,就能够进行upstream模块服务器池的配置了。
#static_pools为静态服务器池,有一个服务器,地址为192.168.0.223,端口为80. upstream static_pools { server 192.168.0.223:80 weght=1; } #upload_pools为上传服务器池,有一个服务器地址为192.168.0.224,端口为80. upstream upload_pools { server 192.168.0.224:80 weight=1; } #default_pools为默认的服务器池,即动态服务器池,有一个服务器,地址为192.168.0.225,端口为80. upstream default_pools { server 192.168.0.225:80 weight=1; } #提示:须要增长一台测试Web节点Web03(ip:192.168.0.225),配置与Web01,Web02同样。
下面利用location或if语句把不一样的URI(路径)请求,分给不一样的服务器池处理,具体配置以下。
方案1:以location方案实现
#将符合static的请求交给静态服务器池static_pools,配置以下: location /static/ { proxy_pass http://static_pools; include proxy.conf; } #将符合upload的请求交给上传服务器池upload_pools,配置以下: location /upload/ { proxy_pass http://upload_pools; include proxy.conf; } #不符合上述规则的请求,默认所有交给动态服务器池default_pools,配置以下: location / { proxy_pass http://default_pools; include proxy.conf; }
方案2:以if语句实现。
if ($request_uri ~* "^/static/(.*)$") { proxy_pass http://static_pools/$1; } if ($request_uri ~* "^/upload/(.*)$") { proxy_pass http://upload_pools/$1; } location / { proxy_pass http://default_pools; include proxy.conf; }
下面以方案1为例进行讲解,Nginx反向代理的实际配置以下:
[root@lb01 ~]# cat /usr/local/nginx/conf/nginx.conf worker_processes 1; events { worker_connections 1024; } http { include mime.types; default_type application/octet-stream; sendfile on; keepalive_timeout 65; upstream static_pools { server 192.168.0.223:80 weight=1; } upstream upload_pools { server 192.168.0.224:80 weight=1; } upstream default_pools { server 192.168.0.225:80 weight=1; } server { listen 80; server_name www.yunjisuan.com; location / { proxy_pass http://default_pools; include proxy.conf; } location /static/ { proxy_pass http://static_pools; include proxy.conf; } location /upload/ { proxy_pass http://upload_pools; include proxy.conf; } } }
从新加载配置生效,以下:
[root@lb01 ~]# /usr/local/nginx/sbin/nginx -t nginx: the configuration file /usr/local/nginx/conf/nginx.conf syntax is ok nginx: configuration file /usr/local/nginx/conf/nginx.conf test is successful [root@lb01 ~]# /usr/local/nginx/sbin/nginx -s reload
暂时不要马上测试成果,为了实现上述代理的测试,还须要在Web01和Web02上作节点的测试配置,才能更好地展现测试效果。
以Web01做为static静态服务,地址端口为:192.168.0.223:80,须要事先配置一个用于测试静态的地址页面,并测试访问,肯定它会返回正确结果。操做步骤以下:
[root@web01 ~]# cd /usr/local/nginx/html/www/ [root@web01 www]# mkdir static [root@web01 www]# echo "static_pools" >> static/index.html [root@web01 www]# curl http://www.yunjisuan.com/static/index.html #这里的www.yunjisuan.com是解析过的Web01的本地IP static_pools #提示:测试的静态地址为http://www.yunjisuan.com/static/index.html,注意,是带static路径的地址。
以Web02做为upload上传服务,地址端口为:192.168.0.224:80,须要事先配置一个用于测试上传服务的地址页面,并测试访问,肯定它会返回正确结果。操做步骤以下:
[root@web02 ~]# cd /usr/local/nginx/html/www/ [root@web02 www]# mkdir upload [root@web02 www]# echo "upload_pools" >> upload/index.html [root@web02 www]# curl http://www.yunjisuan.com/upload/index.html #这里的www.yunjisuan.com是解析过的Web02的本地IP upload_pools #提示:测试的上传地址为http://www.yunjisuan.com/upload/index.html,注意,是带upload路径的地址。
在Web03做为动态服务节点,地址端口为192.168.0.225:80,一样须要事先配置一个默认的地址页面,并测试访问,肯定它会返回正确结果。操做步骤以下:
[root@web03 www]# cd /usr/local/nginx/html/www [root@web03 www]# echo "default_pools" >> index.html [root@web03 www]# curl http://www.yunjisuan.com default_pools
以上准备了上台Web节点服务器,分别加入到了upstream定义的不一样服务器池,表明三组不一样的业务集群组,从本机经过hosts解析各自的域名,而后测试访问,其地址与实际访问的内容输出请对照下表:
节点 | IP及端口 | 测试地址 | 字符串为表明业务 |
---|---|---|---|
web01 | 192.168.0.223:80 | http://www.yunjisuan.com/static/index.html | static_pools |
web02 | 192.168.0.224:80 | http://www.yunjisuan.com/upload/index.html | upload_pools |
web03 | 192.168.0.225:80 | http://www.yunjisuan.com | default_pools |
使用客户端计算机访问测试时,最好选用集群之外的机器,这里先在浏览器客户端的hosts文件里把www.yunjisuan.com解析到Nginx反向代理服务器的IP,而后访问上述URL,看代理是否是把请求正确地转发到了指定的服务器上。若是能够获得与上表对应的内容,表示配置的Nginx代理分发的彻底正确,由于若是分发请求到错误的机器上就没有对应的URL页面内容,输出会是404错误。
- 根据HTTP的URL进行转发的应用状况,被称为第7层(应用层)的负载均衡,而LVS的负载均衡通常用于TCP等的转发,所以被称为第4层(传输层)的负载均衡。
- 在企业中,有时但愿只用一个域名对外提供服务,不但愿使用多个域名对应同一个产品业务,此时就须要在代理服务器上经过配置规则,使得匹配不一样规则的请求会交给不一样的服务器池处理。这类业务有:
- 业务的域名没有拆封或者不但愿拆分,但但愿实现动静分离,多业务分离,这在前面已经讲解过案例了。
- 不一样的客户端设备(例如:手机和PC端)使用同一个域名访问同一个业务网站,就须要根据规则将不一样设备的用户请求交给后端不一样的服务器处理,以便获得最佳用户体验。这也是很是重要的,接下来,我就带同窗们看看这类的相关案例。
在企业中,为了让不一样的客户端设备用户访问有更好的体验,须要在后端架设不一样服务器来知足不一样的客户端访问,例如:移动客户端访问网站,就须要部署单独的移动服务器及程序,体验才能更好,并且移动端还分苹果,安卓,Ipad等,在传统的状况下,通常用下面的办法解决这个问题。
(1)常规4层负载均衡解决方案架构
在常规4层负载均衡架构下,可使用不一样的域名来实现这个需求,例如,人为分配好让移动端用户访问wap.yunjisuan.com,PC客户端用户访问www.yunjisuan.com,经过不一样域名来引导用户到指定的后端服务器,该解决方案的架构图以下:
此解决方案的最大问题就是不一样客户端的用户要记住对应的域名!而绝大多数用户只会记住www.yunjisuan.com,不会记住wap.yunjisuan.com,这样一来就会致使用户体验不是很好。有没有办法让全部客户端用户只访问一个统一的www.yunjisuan.com这个地址,还能让不一样客户端设备都能有更好的访问体验呢?固然有!那就是下面的第7层负载均衡解决方案。
(2)第7层负载均衡解决方案
在第7层负载均衡架构下,就能够不须要人为拆分域名了,对外只须要用一个域名,例如www.yunjisuan.com,经过获取用户请求中的设备信息(利用$http_user_agent获取),根据这些信息转给后端合适的服务器处理,这个方案最大好处就是不须要让用户记忆多个域名了,用户只须要记住主网站地址www.yunjisuan.com,剩下的由网站服务器处理,这样的思路大大地提高了用户访问体验,这是当前企业网站很是经常使用的解决方案。
下面咱们就来说解此方案,下图描述了上述解决方案相应的架构逻辑图
这里仍是使用static_pools,upload_pools做为本次实验的后端服务器池。下面先根据计算机客户端浏览器的不一样设置对应的匹配规则。(因为没有合适的实验验证环境,这里仅做需求实现的细节讲解)
location / { if ($http_user_agent ~* "MSIE") #若是请求的浏览器为微软IE浏览器(MSIE),则让请求由static_pools池处理 { proxy_pass http://static_pools; } if ($http_user_agent ~* "Chrome") #若是请求的浏览器为谷歌浏览器(Chrome),则让请求由upload_pools池处理 { proxy_pass http://upload_pools; } proxy_pass http://default_pools; #其余客户端,由default_pools处理 include proxy.conf; }
除了针对浏览器外,上述“$http_user_agent”变量也可针对移动端,好比安卓,苹果,Ipad设备进行匹配,去请求指定的服务器,具体细节配置以下:
location / { if ($http_user_agent ~* "android") { proxy_pass http://android_pools; #这里是android服务器池 } if ($http_user_agent ~* "iphone") { proxy_pass http://iphone_pools; #这里是iphone服务器池 } proxy_pass http://pc_pools; #这里是默认的pc服务器池 include extra/proxy.conf; }
- 这部分的测试同窗们能够回家经过局域网的Wifi功能来实现,用手机等链接到wifi,而后访问服务器的IP测试就能够了。测试时,请用节点的第一个虚拟主机请求测试,这样就不须要本地hosts域名解析了,由于手机端测试作hosts解析也不容易,固然有公网的域名和服务器测试最佳,这部分的配合和测试与浏览器设备实践几乎同样,所以,这里的测试就留给同窗们了,看看能不能达到你想的测试效果?
- 此外,查找移动设备的user_agent对应的具体名称时,仍是先用对应的设备经过IP地址访问节点服务器,而后看访问日志,注意IP访问只找第一个虚拟主机的网站。
192.168.0.110--[28/Jul/2017:02:12:10 -0400]"GET / HTTP/1.1"200 18 "-""Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 10.0; WOW64; Trident/7.0; .NET4.0C; .NET4.0E; .NET CLR 2.0.50727; .NET CLR 3.0.30729; .NET CLR 3.5.30729)""-" #PCwindows访问日志 192.168.0.106--[28/Jul/2017:02:12:22 -0400]"GET / HTTP/1.1"200 18 "-""Mozilla/5.0 (iPhone; CPU iPhone OS 10_3_3 like Mac OS X) AppleWebKit/603.3.8 (KHTML, like Gecko) Version/10.0 Mobile/14G60 Safari/602.1""-" #苹果iphone6手机设备访问的日志。
除了根据URI路径及user_agent转发外,还能够实现根据文件扩展名进行转发(这里仅以细节配置做为讲解内容,如需测试请同窗们自行实验)
#先看看location方法的匹配规则,以下: location ~ .*\.(gif|jpg|jpeg|png|bmp|swf|css|js)$ { proxy_pass http://static_pools; include proxy.conf; } #下面是if语句方法的匹配规则: if ($request_uri ~* ".*\.(php|php5)$") { proxy_pass http://php_server_pools; } if ($request_uri ~* ".*\.(jsp|jsp*|do|do*)$") { proxy_pass http://java_server_pools; }
可根据扩展名实现资源的动静分离访问,如图片,视频等请求静态服务器池,PHP,JSP等请求动态服务器池。
location ~ .*\.(gif|jpg|jpeg|png|bmp|swf|css|js)$ { proxy_pass http://static_pools; include proxy.conf; } location ~ .*\.(php|php3|php5)$ { proxy_pass http://dynamic_pools; include proxy.conf }
在开发没法经过程序实现动静分离的时候,运维能够根据资源实体进行动静分离,而不依赖于开发,具体实现策略是先把后端的服务器分红不一样的组。注意,每组服务器的程序都是相同的,由于开发没有把程序拆开,分组后,在前端代理服务器上经过讲解过的路径,扩展名进行规则匹配,从而实现请求的动静分离。
淘宝技术团队开发了一个Tengine(Nginx的分支)模块Nginx_upstream_check_module,用于提供主动式后端服务器健康检查。经过它能够检测后端realserver的健康状态,若是后端realserver不可用,则全部的请求就不会转发到该节点上。
Tengine原生支持这个模块,而Nginx则须要经过打补丁的方式将该模块添加到Nginx中。补丁下载地址:https://github.com/yaoweibin/nginx_upstream_check_module。下面介绍如何使用这个模块。
(1)安装nginx_upstream_check_module模块
#系统已经安装了nginx-1.10.2软件 [root@lb01 ~]# /usr/local/nginx/sbin/nginx -V nginx version: nginx/1.10.2 #下载补丁包 [root@lb01 ~]# wget https://codeload.github.com/yaoweibin/nginx_upstream_check_module/zip/master [root@lb01 ~]# unzip master [root@lb01 ~]# ls anaconda-ks.cfg install.log install.log.syslog master nginx-1.10.2.tar.gz nginx_upstream_check_module-master [root@lb01 nginx-1.10.2]# mv ~/nginx_upstream_check_module-master /usr/src/ #由于是对源程序打补丁,因此还须要Nginx源程序 [root@lb01 ~]# cd /usr/src/nginx-1.10.2/ [root@lb01 nginx-1.10.2]# patch -p0 < /usr/src/nginx_upstream_check_module-master/check_1.9.2+.patch patching file src/http/modules/ngx_http_upstream_hash_module.c patching file src/http/modules/ngx_http_upstream_ip_hash_module.c patching file src/http/modules/ngx_http_upstream_least_conn_module.c patching file src/http/ngx_http_upstream_round_robin.c patching file src/http/ngx_http_upstream_round_robin.h #备份源安装程序 [root@lb01 nginx-1.10.2]# cd /usr/local/ [root@lb01 local]# ls bin etc games include lib lib64 libexec nginx sbin share src [root@lb01 local]# mv nginx{,.ori} [root@lb01 local]# ls bin etc games include lib lib64 libexec nginx.ori sbin share src [root@lb01 local]# cd /usr/src/nginx-1.10.2/ #从新进行编译,编译的参数要和之前一致,最后加上 --add-module=/usr/src/nginx_upstream_check_module-master/ [root@lb01 nginx-1.10.2]# ./configure --prefix=/usr/local/nginx --user=nginx --group=nginx --with-http_ssl_module --with-http_stub_status_module --add-module=/usr/src/nginx_upstream_check_module-master/ [root@lb01 local]# /usr/local/nginx/sbin/nginx -V nginx version: nginx/1.10.2 built by gcc 4.4.7 20120313 (Red Hat 4.4.7-4) (GCC) built with OpenSSL 1.0.1e-fips 11 Feb 2013 TLS SNI support enabled configure arguments: --prefix=/usr/local/nginx --user=nginx --group=nginx --with-http_ssl_module --with-http_stub_status_module --add-module=/usr/src/nginx_upstream_check_module-master/ #拷贝源配置文件到当前Nginx的安装目录下 [root@lb01 local]# pwd /usr/local [root@lb01 local]# cp nginx.ori/conf/nginx.conf nginx/conf/ cp: overwrite `nginx/conf/nginx.conf'? y [root@lb01 local]# cp nginx.ori/conf/proxy.conf nginx/conf/ [root@lb01 local]# /usr/local/nginx/sbin/nginx -t nginx: the configuration file /usr/local/nginx/conf/nginx.conf syntax is ok nginx: configuration file /usr/local/nginx/conf/nginx.conf test is successful
(2)配置Nginx健康检查,以下:
[root@lb01 local]# cat nginx/conf/nginx.conf worker_processes 1; events { worker_connections 1024; } http { include mime.types; default_type application/octet-stream; sendfile on; keepalive_timeout 65; upstream static_pools { server 192.168.0.223:80 weight=1; server 192.168.0.224:80 weight=1; check interval=3000 rise=2 fall=5 timeout=1000 type=http; #对static服务器池开启健康监测 } upstream default_pools { server 192.168.0.225:80 weight=1; } server { listen 80; server_name www.yunjisuan.com; location / { proxy_pass http://default_pools; include proxy.conf; } location ~ .*\.(gif|jpg|jpeg|png|bmp|swf|css|js)$ { proxy_pass http://static_pools; include proxy.conf; } location /status { check_status; #启动健康检查模块 access_log off; #关闭此location的访问日志记录 } } }
重启lb1的nginx服务
[root@lb01 local]# /usr/local/nginx/sbin/nginx [root@lb01 local]# netstat -antup | grep nginx tcp 0 0 0.0.0.0:80 0.0.0.0:* LISTEN 7008/nginx #注意此处必须重启Nginx,不能从新加载
check interval=3000 rise=2 fall=5 timeout=1000 type=http;
上面配置的意思时,对static_pools这个负载均衡条目中的全部节点,每隔3秒检测一次,请求2次正常则标记realserver状态为up,若是检测5次都失败,则标记realserver的状态为down,超时时间为1秒,检查的协议是HTTP。
详细用法见官网:http://tengine.taobao.org/document_cn/http_upstream_check_cn.html
访问页面时,显示以下图所示:
在lb1配置文件的upstream default_pools{}里也加入健康监测命令,以下:
[root@lb01 local]# cat nginx/conf/nginx.conf worker_processes 1; events { worker_connections 1024; } http { include mime.types; default_type application/octet-stream; sendfile on; keepalive_timeout 65; upstream static_pools { server 192.168.0.223:80 weight=1; server 192.168.0.224:80 weight=1; check interval=3000 rise=2 fall=5 timeout=1000 type=http; #对static服务器池开启健康监测 } upstream default_pools { server 192.168.0.225:80 weight=1; check interval=3000 rise=2 fall=5 timeout=1000 type=http; #对default服务器池开启健康监测 } server { listen 80; server_name www.yunjisuan.com; location / { proxy_pass http://default_pools; include proxy.conf; } location ~ .*\.(gif|jpg|jpeg|png|bmp|swf|css|js)$ { proxy_pass http://static_pools; include proxy.conf; } location /status { check_status; #启动健康检查模块 access_log off; #关闭此location的访问日志记录 } } }
再次访问健康监测页面时,显示以下图所示:
关闭任意一个RS节点后(3个Web服务器任选一个关闭nginx服务)
#关闭Web02的nginx服务 [root@web02 ~]# /usr/local/nginx/sbin/nginx -s stop
再次访问健康监测页面时,显示以下图所示:
当Nginx接收后端服务器返回proxy_next_upstream参数定义的状态码时,会将这个请求转发给正常工做的后端服务器,例如500,502,503,504,此参数能够提高用户的访问体验,具体配置以下:
server { listen 80; server_name www.yunjisuan.com; location / { proxy_pass http://static_pools; proxy_next_upstream error timeout invalid_header http_500 http_502 http_503 http_504; include proxy.conf; } }