解析nginx负载均衡

摘要:对于一个大型网站来讲,负载均衡是永恒的话题。随着硬件技术的迅猛发展,愈来愈多的负载均衡硬件设备涌现出来,如F5 BIG-IP、Citrix NetScaler、Radware等等,虽然能够解决问题,但其高昂的价格却每每使人望而却步,所以负载均衡软件仍然是大部分公司的不二之选。nginx做为webserver的后起之秀,其优秀的反向代理功能和灵活的负载均衡策略受到了业界普遍的关注。本文将以工业生产为背景,从设计实现和具体应用等方面详细介绍nginx负载均衡策略。 php

关键字:nginx 负载均衡 反向代理 前端

1.前言

随着互联网信息的爆炸性增加,负载均衡(load balance)已经再也不是一个很陌生的话题,顾名思义,负载均衡便是将负载分摊到不一样的服务单元,既保证服务的可用性,又保证响应足够快,给用户很好的体验。快速增加的访问量和数据流量催生了各式各样的负载均衡产品,不少专业的负载均衡硬件提供了很好的功能,但却价格不菲,这使得负载均衡软件大受欢迎,nginx就是其中的一个。 nginx

nginx第一个公开版本发布于2004年,2011年发布了1.0版本。它的特色是稳定性高、功能强大、资源消耗低,从其目前的市场占有而言,nginx大有与apache抢市场的势头。其中不得不提到的一个特性就是其负载均衡功能,这也成了不少公司选择它的主要缘由。本文将从源码的角度介绍nginx的内置负载均衡策略和扩展负载均衡策略,以实际的工业生产为案例,对比各负载均衡策略,为nginx使用者提供参考。 web

2.   源码剖析

nginx的负载均衡策略能够划分为两大类:内置策略和扩展策略。内置策略包含加权轮询和ip hash,在默认状况下这两种策略会编译进nginx内核,只需在nginx配置中指明参数便可。扩展策略有不少,如fair、通用hash、consistent hash等,默认不编译进nginx内核。因为在nginx版本升级中负载均衡的代码没有本质性的变化,所以下面将以nginx1.0.15稳定版为例,从源码角度分析各个策略。 算法

2.1.           加权轮询(weighted round robin)

轮询的原理很简单,首先咱们介绍一下轮询的基本流程。以下是处理一次请求的流程图: apache

图中有两点须要注意,第一,若是能够把加权轮询算法分为先深搜索和先广搜索,那么nginx采用的是先深搜索算法,即将首先将请求都分给高权重的机器,直到该机器的权值降到了比其余机器低,才开始将请求分给下一个高权重的机器;第二,当全部后端机器都down掉时,nginx会当即将全部机器的标志位清成初始状态,以免形成全部的机器都处在timeout的状态,从而致使整个前端被夯住。 后端

接下来看下源码。nginx源码的目录结构很清晰,加权轮询所在路径为nginx-1.0.15/src/http/ngx_http_upstream_round_robin.[c|h],在源码的基础上,针对重要的、不易理解的地方我加了注释。首先看下ngx_http_upstream_round_robin.h中的重要声明: 数组

从变量命名中,咱们就能够大体猜出其做用。其中,current_weight和weight的区别主要是前者为权重排序的值,随着处理请求会动态的变化,后者是配置值,用于恢复初始状态。 缓存

接下来看下轮询的建立过程,代码以下图所示。 服务器

这里有个tried变量须要作些说明。tried中记录了服务器当前是否被尝试链接过。他是一个位图。若是服务器数量小于32,则只需在一个int中便可记录下全部服务器状态。若是服务器数量大于32,则需在内存池中申请内存来存储。对该位图数组的使用可参考以下代码:

最后是实际的策略代码,逻辑很简单,代码实现也只有30行,直接上代码。

2.2.           ip hash

ip hash是nginx内置的另外一个负载均衡的策略,流程和轮询很相似,只是其中的算法和具体的策略有些变化,以下图所示:

ip hash算法的核心实现以下图:

从代码中能够看出,hash值既与ip有关又与后端机器的数量有关。通过测试,上述算法能够连续产生1045个互异的value,这是该算法的硬限制。对此nginx使用了保护机制,当通过20次hash仍然找不到可用的机器时,算法退化成轮询。所以,从本质上说,ip hash算法是一种变相的轮询算法,若是两个ip的初始hash值刚好相同,那么来自这两个ip的请求将永远落在同一台服务器上,这为均衡性埋下了很深的隐患。

2.3.           fair

fair策略是扩展策略,默认不被编译进nginx内核。其原理是根据后端服务器的响应时间判断负载状况,从中选出负载最轻的机器进行分流。这种策略具备很强的自适应性,可是实际的网络环境每每不是那么简单,所以要慎用。

2.4.           通用hash、一致性hash

这两种也是扩展策略,在具体的实现上有些差异,通用hash比较简单,能够以nginx内置的变量为key进行hash,一致性hash采用了nginx内置的一致性hash环,能够支持memcache。

3.   对比测试

本测试主要为了对比各个策略的均衡性、一致性、容灾性等,从而分析出其中的差别性,并据此给出各自的适用场景。为了可以全面、客观的测试nginx的负载均衡策略,咱们采用了两个测试工具、在不一样场景下作测试,以此来下降环境对测试结果形成的影响。首先简单介绍测试工具、测试网络拓扑和基本的测试流程。

3.1.           测试工具

3.1.1  easyABC

easyABC是公司内部开发的性能测试工具,采用epool模型实现,简单易上手,能够模拟GET/POST请求,极限状况下能够提供上万的压力,在公司内部获得了普遍的使用。因为被测试对象为反向代理服务器,所以须要在其后端搭建桩服务器,这里用nginx做为桩webserver,提供最基本的静态文件服务。

3.1.2  polygraph

polygraph是一款免费的性能测试工具,以对缓存服务、代理、交换机等方面的测试见长。它有规范的配置语言PGL(Polygraph Language),为软件提供了强大的灵活性。其工做原理以下图所示:

polygraph提供client端和server端,将测试目标nginx放在两者之间,三者之间的网络交互均走http协议,只需配置ip+port便可。client端能够配置虚拟robot的个数以及每一个robot发请求的速率,并向代理服务器发起随机的静态文件请求,server端将按照请求的url生成随机大小的静态文件作响应。这也是选用这个测试软件的一个主要缘由:能够产生随机的url做为nginx各类hash策略的key。

另外,polygraph还提供了日志分析工具,功能比较丰富,感兴趣的同窗能够参考附录中的相关材料。

3.2.           测试环境

本测试运行在5台物理机上,其中被测对象单独搭在一台8核机器上,另外四台4核机器分别搭建了easyABC、webserver桩和polygraph,以下图所示:

3.3.           测试方案

首先介绍下关键的测试指标:

均衡性:是否可以将请求均匀的发送给后端

一致性:同一个key的请求,是否能落到同一台机器

容灾性:当部分后端机器挂掉时,是否可以正常工做

以上述指标为指导,咱们针对以下四个测试场景分别用easyABC和polygraph进行测试:

场景1      server_*均正常提供服务;

场景2      server_4挂掉,其余正常;

场景3      server_三、server_4挂掉,其余正常;

场景4      server_*均恢复正常服务。

上述四个场景将按照时间顺序进行,每一个场景将创建在上一个场景基础上,被测试对象无需作任何操做,以最大程度模拟实际状况。另外,考虑到测试工具自身的特色,在easyabc上的测试压力在17000左右,polygraph上的测试压力在4000左右。以上测试均保证被测试对象能够正常工做,且无任何notice级别以上(alert/error/warn)的日志出现,在每一个场景中记录下server_*的qps用于最后的策略分析。

3.4.           测试结果

表1和图1是轮询策略在两种测试工具下的负载状况。对比在两种测试工具下的测试结果会发现,结果彻底一致,所以能够排除测试工具的影响。从图表中能够看出,轮询策略对于均衡性和容灾性均可以作到很好的知足。(点击图片查看大图)

表2和图2是fair策略在两种测试工具下的负载状况。fair策略受环境影响很是大,在排除了测试工具的干扰以后,结果仍然有很是大的抖动。从直观上讲,这彻底不知足均衡性。可是从另外一个角度出发,偏偏是因为这种自适应性确保了在复杂的网络环境中可以物尽所用。所以,在应用到工业生产中以前,须要在具体的环境中作好测试工做。(点击图片查看大图)

如下图表是各类hash策略,所不一样的仅仅是hash key或者是具体的算法实现,所以一块儿作对比。实际测试中发现,通用hash和一致性hash均存在一个问题:当某台后端的机器挂掉时,原有落到这台机器上的流量会丢失,可是在ip hash中就不存在这样的问题。正如上文中对ip hash源码的分析,当ip hash失效时,会退化为轮询策略,所以不会有丢失流量的状况。从这个层面上说,ip hash也能够当作是轮询的升级版。(点击图片查看大图)

图5为ip hash策略,ip hash是nginx内置策略,能够看作是前两种策略的特例:以来源ip为key。因为测试工具不便于模拟海量ip下的请求,所以这里截取线上实际的状况加以分析,以下图所示:

图5 ip hash策略

图中前1/3使用轮询策略,中间段使用ip hash策略,后1/3仍然是轮询策略。能够明显的看出,ip hash的均衡性存在着很大的问题。缘由并不难分析,在实际的网络环境中,有大量的高校出口路由器ip、企业出口路由器ip等网络节点,这些节点带来的流量每每是普通用户的成百上千倍,而ip hash策略偏偏是按照ip来划分流量,所以形成上述后果也就天然而然了。

4.   总结与展望

经过实际的对比测试,咱们对nginx各个负载均衡策略进行了验证。下面从均衡性、一致性、容灾性以及适用场景等角度对比各类策略。(点击图片查看大图)

以上从源码和实际的测试数据角度分析说明了nginx负载均衡的策略,并给出了各类策略适合的应用场景。经过本文的分析不难发现,不管哪一种策略都不是万金油,在具体的场景下应该选择哪一种策略必定程度上依赖于使用者对这些策略的熟悉程度。但愿本文的分析和测试数据可以对读者有所帮助,更但愿有愈来愈多、愈来愈好的负载均衡策略产出。

5.   参考资料

http://wiki.nginx.org/HttpUpstreamConsistentHash

http://wiki.nginx.org/HttpUpstreamFairModule

http://wiki.nginx.org/HttpUpstreamRequestHashModule

http://www.web-polygraph.org/

http://nginx.org/

相关文章
相关标签/搜索