负载均衡集群解决方案（二）Nginx

时间 2020-08-29

原文原文链接

Nginx是一个免费的，开源的，高性能的服务器和反向代理服务器软件，同时它也能够为IMAP和POP3服务器代理，以其高性能，稳定性，丰富的功能，结构简单，低资源消耗的特性换来广大运维者所喜好。javascript

Nginx与传统的服务器不一样，不依赖线程来处理请求。相反，它使用一个更可扩展事件驱动架构(异步)。这种结构资源消耗较小，但更重要的是，能够承受较大的请求负荷。即便你不但愿处理成千上万的请求，你仍然能够受益于Nginx的高性能和小的内存占用，以及其丰富的功能。php

Nginx的反向代理：css

反向代理指以代理服务器来接受Internet上的链接请求，而后将请求转发给内部网络上的服务器，并将从服务器上获得的结果返回给Internet上请求链接到客户端，此时代理服务器对外就表现为一个服务器，而此种工做模式相似于LVS-NET模型。前端

反向代理也能够理解为web服务器加速，它是一种经过在繁忙的web服务器和外部网络之间增长的一个高速web缓冲服务器，用来下降实际的web服务器的负载的一种技术。反向代理是针对web服务器提升加速功能，全部外部网络要访问服务器时的全部请求都要经过它，这样反向代理服务器负责接收客户端的请求，而后到源服务器上获取内容，把内容返回给用户，并把内容保存在本地，以便往后再收到一样的信息请求时，它会将本地缓存里的内容直接发给用户，已减小后端web服务器的压力，提升响应速度。所以Nginx还具备缓存功能。java

反向代理的工做流程：nginx

1）用户经过域名发出访问请求，该域名被解析为反向代理服务器的IP地址；git

2）反向代理服务器接收用户的请求；github

3）反向代理服务器在本地缓存查找是否存在当前用户所请求的内容，找到则直接把内容返回给用户；web

4）若是本地没有用户请求的内容，反向代理服务器会以本身的身份去后端服务器请求一样的信息内容，并把信息内容发给用户，若是信息内容是能够被缓存的，则会将该内容缓存在代理服务器的本地缓存中。正则表达式

反向代理的好处：

1）解决了网站服务器对外可见的问题，提升了网站服务器的安全性；

2）节约了有限的IP地址资源，后端服务器都可使用私有IP地址与代理服务器进行通讯；

3）加速了网站的访问速度，减轻了真是web服务器的负荷。

(一)、调度算法

Nginx的upstream指令用于指定proxy_pass和fastcgi_pass所使用的后端服务器，即nginx的反向代理功能，所以能够将二者结合起来使用以达到负载均衡的目的，而Nginx也支持多种调度算法：

一、轮询（默认）

每一个请求按时间顺序逐一分配到不一样的后端服务器，若是后端服务器down掉，则会跳过该服务器分配至下一个监控的服务器。而且它无需记录当前全部链接的状态，因此它是一种无状态调度。

二、weight

指定在轮询的基础上加上权重，weight和访问比率成正比，即用于代表后端服务器的性能好坏，若后端服务器性能较好则可将大部分请求分配给它，已实现其力所能及。

例如：

我后端服务器172.23.136.148配置：E5520*2 CPU，8G内存

后端服务器172.23.136.148配置：Xeon(TM)2.80GHz * 2，4G内存

我但愿在有30个请求到达前端时，其中20个请求交给172.23.136.148处理，剩余10个请求交给172.23.136.149处理，就可作以下配置

upstream web_poll {

server 172.23.136.148 weight=10;

server 172.23.136.149 weight=5;

}

三、ip_hash

每一个请求按访问ip的hash结果分配，当新的请求到达时，先将其客户端IP经过哈希算法进行哈希出一个值，在随后的请求客户端IP的哈希值只要相同，就会被分配至同一个后端服务器，该调度算法能够解决session的问题，但有时会致使分配不均即没法保证负载均衡。

例如：

upstream web_pool {

ip_hash;

server 172.23.136.148:80;

server 172.23.136.149:80;

}

四、fair（第三方）

按后端服务器的响应时间来分配请求，响应时间短的优先分配。

upstream web_pool {

server 172.23.136.148;

server 172.23.136.149;

fair;

}

五、url_hash（第三方）

按访问url的hash结果来分配请求，使每一个url定向到同一个后端服务器，后端服务器为缓存时比较有效。

例：在upstream中加入hash语句，server语句中不能写入weight等其余的参数，hash_method是使用的hash算法

upstream web_pool {

server squid1:3128;

server squid2:3128;

hash $request_uri;

hash_method crc32;

}

每一个设备的状态设置为:

1.down 表示当前的server不参与负载,用于ip_hash中

2.weight 默认为1.weight越大，负载的权重就越大。

3.max_fails 容许请求失败的次数默认为1.设为0则表示关闭该项功能，当超过最大次数时，返回proxy_next_upstream 模块定义的错误

4.fail_timeout 在max_fails定义的失败次数后，暂停的时间。

5.backup 能够将其理解为备机，其它全部的非backup机器down或者忙的时候，才会将请求分配给backup机器。因此这台机器压力会最轻。

nginx支持同时设置多组的负载均衡，用来给不用的server来使用。

(二)、指令的使用

一、upstream

声明一组能够被proxy_pass和fastcgi_pass引用的服务器；这些服务器可使用不一样的端口，而且也可使用Unix Socket；也能够为服务器指定不一样的权重。如：

upstream web_pool {

server coolinuz.9966.org weight=5;

server 172.23.136.148:8080 max_fails=3 fail_timeout=30s;

server unix:/tmp/backend3;

}

二、server

语法：server name [parameters]

其中的name能够是FQDN，主机地址，端口或unix套接字；若是FQDN解析的结果为多个地址，则每一个地址都会被用到。

三、proxy_pass

语法：proxy_pass URL;

该指令用于指定代理服务器的地址和URL将被映射为的URL或地址和端口。即用来指定后端服务器的地址或URL[端口]。

四、proxy_set_header

语法：proxy_set_header header value;

该指令容许从新定义和添加一些将被转移到被代理服务器的请求头部信息。

例如：

proxy_set_header Host $host;

proxy_set_header X-Real-IP $remote_addr;

proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;

注意：$proxy_add_x_forwarded_for包含客户端请求头中的"X-Forwarded-For"，与$remote_addr用逗号分开，若是没有"X-Forwarded-For" 请求头，则$proxy_add_x_forwarded_for等于$remote_addr

顺便补上Nginx的内置变量：

$args, 请求中的参数;

$is_args, 若是已经设置$args，则该变量的值为“？”，不然为“”。

$content_length, HTTP请求信息头里的"Content-Length";

$content_type, 请求信息头里的"Content-Type";

$document_root, 针对当前请求所属的root指令设置的根目录路径;

$document_uri, 与$uri相同;

$host, 请求信息中的"Host"，若是请求中没有Host行，则等于设置的服务器名;

$limit_rate, 对链接速率的限制;

$request_method, 请求的方法，好比"GET"、"POST"等;

$remote_addr, 客户端地址;

$remote_port, 客户端端口号;

$remote_user, 客户端用户名，认证用;

$request_filename, 当前请求的文件路径名

$request_body_file, 客户端请求主体的临时文件名。

$request_uri, 请求的URI，带参数;

$query_string, 与$args相同;

$scheme, 所用的协议，好比http或者是https，好比rewrite ^(.+)$ $scheme://example.com$1 redirect;

$server_protocol, 请求的协议版本，"HTTP/1.0"或"HTTP/1.1";

$server_addr, 服务器地址，若是没有用listen指明服务器地址，使用这个变量将发起一次系统调用以取得地址(形成资源浪费);

$server_name, 请求到达的服务器名;

$server_port, 请求到达的服务器端口号;

$uri, 请求的URI，可能和最初的值有不一样，好比通过重定向之类的。

五、proxy_read_timeout

语法：proxy_read_timeout time;

这个指令设置Nginx与后端服务器创建链接后。等待后端服务器的响应时间

六、proxy_send_timeout

语法：roxy_send_timeout time;

该指令指定请求转移到后端服务器的超时时间。整个传输的要求时间不超过超时时间，但只有两次写操做之间。若是在此时间以后的后端服务器将不采起新的数据，而后nginx将关闭链接。

七、proxy_connect_timeout

语法：proxy_connect_timeout time;

该指令用来设置分配到后端服务器的链接超时时间。

八、proxy_buffers

语法: proxy_buffers the_number is_size;

该指令设置缓冲区的数目和大小，缺省状况下，一个缓冲区的大小和页面大小相同。

九、proxy_buffer_size

语法：proxy_buffer_size buffer_size;

代理缓冲区，该指令用于保存用用户的头部信息。

十、proxy_busy_buffers_size

语法：proxy_busy_buffers_size size;

用于当系统负载较大，缓冲区不够用时，能够申请更大的proxy_buffers

十一、proxy_temp_file_write_size

语法：proxy_temp_file_write_size size;

用于指定缓存临时文件的大小

(三)、功能完善

安装配置第三方模块，实现upstream中对后端web server的健康状态检测：

模块下载地址：https://github.com/cep21/healthcheck_nginx_upstreams；模块名称：ngx_http_healthcheck_module

安装配置方法：

一、首先解压healcheck模块到某路径下，这里假设为/tmp/healthcheck_nginx_upstreams

#tar -xvf cep21-healthcheck_nginx_upstreams-16d6ae7.tar.gz -C /tmp/healthcheck_nginx_upstreams

二、对nginx打补丁

首先解压nginx，并进入nginx源码目录：

# tar xf nginx-1.3.4.tar.gz

# cd nginx-1.0.11

# patch -p1 < /tmp/healthcheck_nginx_upstreams/nginx.patch

然后编译nginx，在执行configure时添加相似下面的选项：

--add-module=/tmp/healthcheck_nginx_upstreams

因此，这里就使用以下命令：

# ./configure \
--prefix=/usr/local/nginx \
--sbin-path=/usr/sbin/nginx \
--conf-path=/etc/nginx/nginx.conf \
--lock-path=/var/lock/nginx.lock \
--user=nginx \
--group=nginx \
--with-http_ssl_module \
--with-http_flv_module \
--with-http_stub_status_module \
--with-http_gzip_static_module \
--http-proxy-temp-path=/var/tmp/nginx/proxy/ \
--http-fastcgi-temp-path=/var/tmp/nginx/fcgi/ \
--with-pcre \
--add-module=/tmp/healthcheck_nginx_upstreams
# make && make install

ngx_http_healthcheck_module模块的使用方法：

一、此模块支持的指令有：

healthcheck_enabled ##启用此模块

healthcheck_delay ##对同一台后端服务器两次检测之间的时间间隔，单位毫秒，默认为1000；

healthcheck_timeout ##进行一次健康检测的超时时间，单位为毫秒，默认值2000；

healthcheck_failcount ##对一台后端服务器检测成功或失败多少次以后方才肯定其为成功或失败，并实现启用或禁用此服务器；

healthcheck_send ##为了检测后端服务器的健康状态所发送的检测请求；如：healthcheck_send "GET /health HTTP/1.0" 'Host: coolinuz.9966.org';

healthcheck_expected ##指望从后端服务器收到的响应内容；若是未设置，则表示从后端服务器收到200状态码即为正确；

healthcheck_buffer ##健康状态检查所使用的buffer空间大小；

healthcheck_status

经过相似stub_status的方式输出检测信息，使用方法以下：

location /stat {

healthcheck_status;

}

(四)、配置与实现

配置代码以下：

http {
upstream web_pool {
    server 172.23.136.148:80 weight=10;
    server 172.23.136.149:80 weight=5;
    healthcheck_enabled;
    healthcheck_delay 1000;
    healthcheck_timeout 1000;
    healthcheck_failcount 2;
    healthcheck_send "GET /.health HTTP/1.0";
}
server {
    listen 80;
    location / {
      proxy_set_header Host $http_host;
      proxy_set_header X-Real-IP $remote_addr;
      proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
      proxy_pass http://web_pool;
      proxy_connect_timeout 3;
    }
    location /stat {
      healthcheck_status;
    }
}
}

在这里设置“proxy_set_header”参数，是由于Nginx在作反向代理的时候，要代替客户端去访问服务器，因此，当请求包通过反向代理后，在代理服务器这里这个IP数据包的IP包头作了修改，最终后端web服务器获得的数据包的头部的源IP地址是代理服务器的IP地址，这样一来，后端服务器的程序给予IP的统计功能就没有任何意义,或者后端web服务器上有多个基于域名的虚拟主机时，就要经过添加Header头信息Host，用于指定请求的域名，这样后端web服务器才能识别该反向代理访问请求由哪一个虚拟主机来处理。

(五)、小结

经过以上咱们能够看出Nginx的配置实际上是比较其余的web服务器软件是比较简单的，可是其实现的功能确实至关强大丰富的。经过Nginx的反向代理已经支持灵活的正则表达式匹配，能够实现网站的动、静分离，让动态的php等程序网页去访问php web服务器，让缓存页、图片、javascript、css、flash去访问Squid等缓存服务器或文件服务器。加之Nginx对静态内容的高性能，高并发量，Nginx做为前端代理负载均衡成为愈来愈多架构师的首先方案。

本文出自 “My---Dream.*” 博客，请务必保留此出处http://grass51.blog.51cto.com/4356355/1109825

负载均衡集群解决方案 （二）Nginx

负载均衡集群解决方案（二）Nginx