LVS负载均衡工做模式和调度算法

时间 2020-01-18

原文原文链接

原文连接:http://www.javashuo.com/article/p-uvphxafg-da.html算法

1、LVS简介后端

LVS（Linux Virtual Server）即Linux虚拟服务器，是由章文嵩博士主导的开源负载均衡项目，目前LVS已经被集成到Linux内核模块中。该项目在Linux内核中实现了基于IP的数据请求负载均衡调度方案，其体系结构如图1所示，终端互联网用户从外部访问公司的外部负载均衡服务器，终端用户的Web请求会发送给LVS调度器，调度器根据本身预设的算法决定将该请求发送给后端的某台Web服务器，好比，轮询算法能够将外部的请求平均分发给后端的全部服务器，终端用户访问LVS调度器虽然会被转发到后端真实的服务器，但若是真实服务器链接的是相同的存储，提供的服务也是相同的服务，最终用户不论是访问哪台真实服务器，获得的服务内容都是同样的，整个集群对用户而言都是透明的。最后根据LVS工做模式的不一样，真实服务器会选择不一样的方式将用户须要的数据发送到终端用户，LVS工做模式分为NAT模式、TUN模式、以及DR模式。服务器

2、三种工做模式的解析。网络

一、基于NAT的LVS模式负载均衡负载均衡

NAT（Network Address Translation）即网络地址转换，其做用是经过数据报头的修改，使得位于企业内部的私有IP地址能够访问外网，以及外部用用户能够访问位于公司内部的私有IP主机。VS/NAT工做模式拓扑结构如图2所示，LVS负载调度器可使用两块网卡配置不一样的IP地址，eth0设置为私钥IP与内部网络经过交换设备相互链接，eth1设备为外网IP与外部网络联通。函数

第一步，用户经过互联网DNS服务器解析到公司负载均衡设备上面的外网地址，相对于真实服务器而言，LVS外网IP又称VIP（Virtual IP Address），用户经过访问VIP，便可链接后端的真实服务器（Real Server），而这一切对用户而言都是透明的，用户觉得本身访问的就是真实服务器，但他并不知道本身访问的VIP仅仅是一个调度器，也不清楚后端的真实服务器到底在哪里、有多少真实服务器。性能

第二步，用户将请求发送至124.126.147.168，此时LVS将根据预设的算法选择后端的一台真实服务器（192.168.0.1~192.168.0.3），将数据请求包转发给真实服务器，而且在转发以前LVS会修改数据包中的目标地址以及目标端口，目标地址与目标端口将被修改成选出的真实服务器IP地址以及相应的端口。优化

第三步，真实的服务器将响应数据包返回给LVS调度器，调度器在获得响应的数据包后会将源地址和源端口修改成VIP及调度器相应的端口，修改完成后，由调度器将响应数据包发送回终端用户，另外，因为LVS调度器有一个链接Hash表，该表中会记录链接请求及转发信息，当同一个链接的下一个数据包发送给调度器时，从该Hash表中能够直接找到以前的链接记录，并根据记录信息选出相同的真实服务器及端口信息。.net

二、基于TUN的LVS负载均衡设计

在LVS（NAT）模式的集群环境中，因为全部的数据请求及响应的数据包都须要通过LVS调度器转发，若是后端服务器的数量大于10台，则调度器就会成为整个集群环境的瓶颈。咱们知道，数据请求包每每远小于响应数据包的大小。由于响应数据包中包含有客户须要的具体数据，因此LVS（TUN）的思路就是将请求与响应数据分离，让调度器仅处理数据请求，而让真实服务器响应数据包直接返回给客户端。VS/TUN工做模式拓扑结构如图3所示。其中，IP隧道（IP tunning）是一种数据包封装技术，它能够将原始数据包封装并添加新的包头（内容包括新的源地址及端口、目标地址及端口），从而实现将一个目标为调度器的VIP地址的数据包封装，经过隧道转发给后端的真实服务器（Real Server），经过将客户端发往调度器的原始数据包封装，并在其基础上添加新的数据包头（修改目标地址为调度器选择出来的真实服务器的IP地址及对应端口），LVS（TUN）模式要求真实服务器能够直接与外部网络链接，真实服务器在收到请求数据包后直接给客户端主机响应数据。

三、基于DR的LVS负载均衡

在LVS（TUN）模式下，因为须要在LVS调度器与真实服务器之间建立隧道链接，这一样会增长服务器的负担。与LVS（TUN）相似，DR模式也叫直接路由模式，其体系结构如图4所示，该模式中LVS依然仅承担数据的入站请求以及根据算法选出合理的真实服务器，最终由后端真实服务器负责将响应数据包发送返回给客户端。与隧道模式不一样的是，直接路由模式（DR模式）要求调度器与后端服务器必须在同一个局域网内，VIP地址须要在调度器与后端全部的服务器间共享，由于最终的真实服务器给客户端回应数据包时须要设置源IP为VIP地址，目标IP为客户端IP，这样客户端访问的是调度器的VIP地址，回应的源地址也依然是该VIP地址（真实服务器上的VIP），客户端是感受不到后端服务器存在的。因为多台计算机都设置了一样一个VIP地址，因此在直接路由模式中要求调度器的VIP地址是对外可见的，客户端须要将请求数据包发送到调度器主机，而全部的真实服务器的VIP地址必须配置在Non-ARP的网络设备上，也就是该网络设备并不会向外广播本身的MAC及对应的IP地址，真实服务器的VIP对外界是不可见的，但真实服务器却能够接受目标地址VIP的网络请求，并在回应数据包时将源地址设置为该VIP地址。调度器根据算法在选出真实服务器后，在不修改数据报文的状况下，将数据帧的MAC地址修改成选出的真实服务器的MAC地址，经过交换机将该数据帧发给真实服务器。整个过程当中，真实服务器的VIP不须要对外界可见。

3、LVS负载均衡调度算法

根据前面的介绍，咱们了解了LVS的三种工做模式，但无论实际环境中采用的是哪一种模式，调度算法进行调度的策略与算法都是LVS的核心技术，LVS在内核中主要实现了一下十种调度算法。

1.轮询调度

轮询调度（Round Robin 简称'RR'）算法就是按依次循环的方式将请求调度到不一样的服务器上，该算法最大的特色就是实现简单。轮询算法假设全部的服务器处理请求的能力都同样的，调度器会将全部的请求平均分配给每一个真实服务器。

2.加权轮询调度

加权轮询（Weight Round Robin 简称'WRR'）算法主要是对轮询算法的一种优化与补充，LVS会考虑每台服务器的性能，并给每台服务器添加一个权值，若是服务器A的权值为1，服务器B的权值为2，则调度器调度到服务器B的请求会是服务器A的两倍。权值越高的服务器，处理的请求越多。

3.最小链接调度

最小链接调度（Least Connections 简称'LC'）算法是把新的链接请求分配到当前链接数最小的服务器。最小链接调度是一种动态的调度算法，它经过服务器当前活跃的链接数来估计服务器的状况。调度器须要记录各个服务器已创建链接的数目，当一个请求被调度到某台服务器，其链接数加1；当链接中断或者超时，其链接数减1。

（集群系统的真实服务器具备相近的系统性能，采用最小链接调度算法能够比较好地均衡负载。)

4.加权最小链接调度

加权最少链接（Weight Least Connections 简称'WLC'）算法是最小链接调度的超集，各个服务器相应的权值表示其处理性能。服务器的缺省权值为1，系统管理员能够动态地设置服务器的权值。加权最小链接调度在调度新链接时尽量使服务器的已创建链接数和其权值成比例。调度器能够自动问询真实服务器的负载状况，并动态地调整其权值。

5.基于局部的最少链接

基于局部的最少链接调度（Locality-Based Least Connections 简称'LBLC'）算法是针对请求报文的目标IP地址的负载均衡调度，目前主要用于Cache集群系统，由于在Cache集群客户请求报文的目标IP地址是变化的。这里假设任何后端服务器均可以处理任一请求，算法的设计目标是在服务器的负载基本平衡状况下，将相同目标IP地址的请求调度到同一台服务器，来提升各台服务器的访问局部性和Cache命中率，从而提高整个集群系统的处理能力。LBLC调度算法先根据请求的目标IP地址找出该目标IP地址最近使用的服务器，若该服务器是可用的且没有超载，将请求发送到该服务器；若服务器不存在，或者该服务器超载且有服务器处于一半的工做负载，则使用'最少链接'的原则选出一个可用的服务器，将请求发送到服务器。

6.带复制的基于局部性的最少链接

带复制的基于局部性的最少链接（Locality-Based Least Connections with Replication 简称'LBLCR'）算法也是针对目标IP地址的负载均衡，目前主要用于Cache集群系统，它与LBLC算法不一样之处是它要维护从一个目标IP地址到一组服务器的映射，而LBLC算法维护从一个目标IP地址到一台服务器的映射。按'最小链接'原则从该服务器组中选出一一台服务器，若服务器没有超载，将请求发送到该服务器；若服务器超载，则按'最小链接'原则从整个集群中选出一台服务器，将该服务器加入到这个服务器组中，将请求发送到该服务器。同时，当该服务器组有一段时间没有被修改，将最忙的服务器从服务器组中删除，以下降复制的程度。

7.目标地址散列调度

目标地址散列调度（Destination Hashing 简称'DH'）算法先根据请求的目标IP地址，做为散列键（Hash Key）从静态分配的散列表找出对应的服务器，若该服务器是可用的且并未超载，将请求发送到该服务器，不然返回空。

8.源地址散列调度U

源地址散列调度（Source Hashing 简称'SH'）算法先根据请求的源IP地址，做为散列键（Hash Key）从静态分配的散列表找出对应的服务器，若该服务器是可用的且并未超载，将请求发送到该服务器，不然返回空。它采用的散列函数与目标地址散列调度算法的相同，它的算法流程与目标地址散列调度算法的基本类似。

9.最短的指望的延迟

最短的指望的延迟调度（Shortest Expected Delay 简称'SED'）算法基于WLC算法。举个例子吧，ABC三台服务器的权重分别为一、二、3 。那么若是使用WLC算法的话一个新请求进入时它可能会分给ABC中的任意一个。使用SED算法后会进行一个运算

A：（1+1）/1=2 B：（1+2）/2=3/2 C：（1+3）/3=4/3 就把请求交给得出运算结果最小的服务器。

10.最少队列调度

最少队列调度（Never Queue 简称'NQ'）算法，无需队列。若是有realserver的链接数等于0就直接分配过去，不须要在进行SED运算。