五分钟看懂 Nginx 负载均衡

这是第 44 篇不掺水的原创，想获取更多原创好文，请扫 👆上方二维码关注咱们吧~
本文首发于政采云前端团队博客：五分钟看懂 Nginx 负载均衡html

前言

对于电商平台而言，随着业务的不断发展壮大，网站访问量和数据量也随之急剧增加，该状况的产生给服务器带来了必定的负担。从用户体验层面而言，因为服务器端数据处理带来的时延，每每致使页面的响应速度过慢、操做流畅性受阻等问题。这在某种程度上甚至会潜在影响平台的成交量。提供高效率，高质量的服务成为亟待解决的问题。负载均衡策略的出现和发展成为缓解上述问题的有效途径。本文将带你了解基于 Nginx 实现的负载均衡。前端

什么是负载均衡

负载均衡（Load Balance），它在网络现有结构之上能够提供一种廉价、有效、透明的方法来扩展网络设备和服务器的带宽，并能够在必定程度上增长吞吐量、增强网络数据处理能力、提升网络的灵活性和可用性等。用官网的话说，它充当着网络流中“交通指挥官”的角色，“站在”服务器前处理全部服务器端和客户端之间的请求，从而最大程度地提升响应速率和容量利用率，同时确保任何服务器都没有超负荷工做。若是单个服务器出现故障，负载均衡的方法会将流量重定向到其他的集群服务器，以保证服务的稳定性。当新的服务器添加到服务器组后，也可经过负载均衡的方法使其开始自动处理客户端发来的请求。（详情可参考：What Is Load Balancing?）node

简言之，负载均衡实际上就是将大量请求进行分布式处理的策略。nginx

什么是 Nginx 负载均衡

经过上文简单的概念介绍，你可能对负载均衡有了一个初步的了解，知道它是一种调度策略。那么问题来了，Nginx 又是什么呢？Nginx 如何实现负载均衡？这就要从正向代理和反向代理提及了。git

正向代理github

正向代理（Forward Proxy）最大的特色是，客户端很是明确要访问的服务器地址，它代理客户端，替客户端发出请求。好比：棵学上网，俗称 FQ（警告⚠️：FQ 操做违反相关法律规定，本文只是为了解释正向代理向读者举个例子，仅供学习参考，切勿盲目 FQ）。算法

假设客户端想要访问 Google，它明确知道待访问的服务器地址是 www.google.com/，但因为条件限制，它找… Google 的”朋友”：代理服务器。客户端把请求发给代理服务器，由代理服务器代替它请求 Google，最终再将响应返回给客户端。这即是一次正向代理的过程，该过程当中服务器并不知道真正发出请求的是谁。express
反向代理npm

那么，随着请求量的爆发式增加，服务器以为本身一我的始终是应付不过来，须要兄弟服务器们帮忙，因而它喊来了本身的兄弟以及代理服务器朋友。缓存

此时，来自不一样客户端的全部请求实际上都发到了代理服务器处，再由代理服务器按照必定的规则将请求分发给各个服务器。

这就是反向代理（Reverse Proxy），反向代理隐藏了服务器的信息，它代理的是服务器端，代其接收请求。换句话说，反向代理的过程当中，客户端并不知道具体是哪台服务器处理了本身的请求。如此一来，既提升了访问速度，又为安全性提供了保证。

在这之中，反向代理须要考虑的问题是，如何进行均衡分工，控制流量，避免出现局部节点负载过大的问题。通俗的讲，就是如何为每台服务器合理的分配请求，使其总体具备更高的工做效率和资源利用率。
Nginx 是什么？

Nginx 做为一个基于 C 实现的高性能 Web 服务器，能够经过系列算法解决上述的负载均衡问题。而且因为它具备高并发、高可靠性、高扩展性、开源等特色，成为开发人员经常使用的反向代理工具。

负载均衡经常使用算法

1. 轮询（round-robin）

轮询为负载均衡中较为基础也较为简单的算法，它不须要配置额外参数。假设配置文件中共有 M 台服务器，该算法遍历服务器节点列表，并按节点次序每轮选择一台服务器处理请求。当全部节点均被调用过一次后，该算法将从第一个节点开始从新一轮遍历。

特色：因为该算法中每一个请求按时间顺序逐一分配到不一样的服务器处理，所以适用于服务器性能相近的集群状况，其中每一个服务器承载相同的负载。但对于服务器性能不一样的集群而言，该算法容易引起资源分配不合理等问题。

二、加权轮询

为了不普通轮询带来的弊端，加权轮询应运而生。在加权轮询中，每一个服务器会有各自的 weight。通常状况下，weight 的值越大意味着该服务器的性能越好，能够承载更多的请求。该算法中，客户端的请求按权值比例分配，当一个请求到达时，优先为其分配权值最大的服务器。

特色：加权轮询能够应用于服务器性能不等的集群中，使资源分配更加合理化。

Nginx 加权轮询源码可见：ngx_http_upstream_round_robin.c，源码分析可参考：关于轮询策略原理的自我理解。其核心思想是，遍历各服务器节点，并计算节点权值，计算规则为 current_weight 与其对应的 effective_weight 之和，每轮遍历中选出权值最大的节点做为最优服务器节点。其中 effective_weight 会在算法的执行过程当中随资源状况和响应状况而改变。较为核心的部分以下：

for (peer = rrp->peers->peer, i = 0;
	peer; 	/* peer 为当前遍历的服务器结点*/
  peer = peer->next, i++)
{
  ...
    
	/* 每轮遍历会更新 peer 当前的权值*/
	peer->current_weight += peer->effective_weight;

  ...
    
	/* best 为当前服务器中的最优节点，即本轮中选中的服务器节点*/
	if (best == NULL || peer->current_weight > best->current_weight) {
		best = peer;
  	p = i;
	}
  
  ...
}
复制代码

3. IP 哈希（IP hash）

ip_hash 依据发出请求的客户端 IP 的 hash 值来分配服务器，该算法能够保证同 IP 发出的请求映射到同一服务器，或者具备相同 hash 值的不一样 IP 映射到同一服务器。

特色：该算法在必定程度上解决了集群部署环境下 Session 不共享的问题。

Session 不共享问题是说，假设用户已经登陆过，此时发出的请求被分配到了 A 服务器，但 A 服务器忽然宕机，用户的请求则会被转发到 B 服务器。但因为 Session 不共享，B 没法直接读取用户的登陆信息来继续执行其余操做。

实际应用中，咱们能够利用 ip_hash，将一部分 IP 下的请求转发到运行新版本服务的服务器，另外一部分转发到旧版本服务器上，实现灰度发布。再者，如遇到文件过大致使请求超时的状况，也能够利用 ip_hash 进行文件的分片上传，它能够保证同客户端发出的文件切片转发到同一服务器，利于其接收切片以及后续的文件合并操做。

四、其余算法

URL hash

url_hash 是根据请求的 URL 的 hash 值来分配服务器。该算法的特色是，相同 URL 的请求会分配给固定的服务器，当存在缓存的时候，效率通常较高。然而 Nginx 默认不支持这种负载均衡算法，须要依赖第三方库。
最小链接数（Least Connections）

假设共有台服务器，当有新的请求出现时，遍历服务器节点列表并选取其中链接数最小的一台服务器来响应当前请求。链接数能够理解为当前处理的请求数。

应用场景

说了这么多理论，究竟基于 Nginx 的负载均衡要怎么用呢？接下来，将以加权轮询算法为例，带你们尝试经过本身的一台笔记本 + Nginx + Node 测试一下负载均衡。因为没有多台服务器，因而经过本身笔记本的多个不一样端口来模拟不一样的服务器。

Step 1：确保本身的电脑中，Nginx 已安装并可以成功启动（以 Mac 为例）

若是你也遇到了像我同样因为端口占用致使 Nginx 启动失败的问题，能够尝试下述步骤修改配置文件中的端口号

相关文件路径
- /usr/local/etc/nginx/nginx.conf （配置文件路径）
- /usr/local/var/www （服务器默认路径）
- /usr/local/Cellar/nginx/1.8.0 （安装路径）
修改 nginx.conf 文件中的端口
```
server {
  # listen       8080;
  listen       8086;
  server_name  localhost;
}
复制代码
```
Nginx 配置文件 nginx.conf 中主要包含如下几个部分：
- server：主机服务相关设置，主要用于指定虚拟主机域名、IP 和端口
- location：URL 匹配特定位置后的设置，反向代理设置
- upstream：负载均衡相关配置

暂停 Nginx 并重启

// 暂停 Nginx 服务
sudo nginx -s stop
// 启动 Nginx 服务
nginx
复制代码

打开 http://localhost:8086/ 测试是否成功，若是显示下图，则证实启动成功～

Step 2：基于 Node + Express 框架来搭建简单的服务器

Express 是一个简洁而灵活的轻量级 node.js Web 应用框架（详情可了解 Express），若是第一次使用，请先安装。

安装 Express
```
npm i express
复制代码
```

新建 index.js 文件，并写入代码

const express = require('express');
const app = express();

// 定义要监听的端口号
const listenedPort = '8087';

app.get('/', (req, res) => res.send(`Hello World! I am port ${listenedPort}～`));

// 监听端口
app.listen(listenedPort, () => console.log(`success: ${listenedPort}`));
复制代码

启动服务器
```
node index.js
复制代码
```

此处能够多起几个服务，分别让 Node 监听 8087，8088，8089 端口，每一个服务中经过 send 不一样的文案用以区分不一样的 Server。

Step 3：在 nginx.conf 文件中配置好须要轮询的服务器和代理

轮询的服务器，写在 http 中的 upstream 对象里：

upstream testServer {
  server localhost:8087 weight=10;
  server localhost:8088 weight=2;
  server localhost:8089;
}
复制代码

代理地址，写在 http 中的 server 对象里：

location / {
  root   html;
  index  index.html index.htm;
  proxy_pass http://testServer; // testServer 为本身定义的服务器集群
}	
复制代码

Step 4：查看结果

重启 Nginx 服务
再次打开 http://localhost:8086/

经过屡次刷新能够发现，因为设置了不一样的 weight，端口号为 8087 的服务器出现的次数最多，同时证明了权值越高，服务器处理请求概率越大的规则。

总结

Nginx 做为一款优秀的反向代理服务器，能够经过不一样的负载均衡算法来解决请求量过大状况下的服务器资源分配问题。较为常见的负载均衡算法有轮询、加权轮询、IP 哈希等等，可分别应对不一样的请求场景。若是有兴趣能够去 Github 理解下大神的源码，有问题也欢迎一块儿来探讨～

参考文献

招贤纳士

政采云前端团队（ZooTeam），一个年轻富有激情和创造力的前端团队，隶属于政采云产品研发部，Base 在风景如画的杭州。团队现有 50 余个前端小伙伴，平均年龄 27 岁，近 3 成是全栈工程师，妥妥的青年风暴团。成员构成既有来自于阿里、网易的“老”兵，也有浙大、中科大、杭电等校的应届新人。团队在平常的业务对接以外，还在物料体系、工程平台、搭建平台、性能体验、云端应用、数据分析及可视化等方向进行技术探索和实战，推进并落地了一系列的内部技术产品，持续探索前端技术体系的新边界。

若是你想改变一直被事折腾，但愿开始能折腾事；若是你想改变一直被告诫须要多些想法，却无从破局；若是你想改变你有能力去作成那个结果，却不须要你；若是你想改变你想作成的事须要一个团队去支撑，但没你带人的位置；若是你想改变既定的节奏，将会是“ 5 年工做时间 3 年工做经验”；若是你想改变原本悟性不错，但老是有那一层窗户纸的模糊… 若是你相信相信的力量，相信平凡人能成就非凡事，相信能遇到更好的本身。若是你但愿参与到随着业务腾飞的过程，亲手推进一个有着深刻的业务理解、完善的技术体系、技术创造价值、影响力外溢的前端团队的成长历程，我以为咱们该聊聊。任什么时候间，等着你写点什么，发给 ZooTeam@cai-inc.com