四层负载均衡——LVS

时间 2019-11-17

标签四层负载均衡 lvs 栏目负载均衡繁體版

原文原文链接

LVS

参考：http://zh.linuxvirtualserver.org/

几个术语：

Director：也能够称为调度器，LVS前端设备；

realserver：也称为真实内部服务器，是真正在提供服务的；前端

VIP：对外公布的IP，即客户请求进来的IP地址；linux

DIP：调度器和realserver之间通讯的地址；web

LVS的三种工做方式

LVS实现服务器集群负载均衡有三种方式，NAT，DR和TUN，下面简单谈谈这三种方式的区别：

LVS-NAT：

这个方法的思路是实施网络层（IP层）数据欺骗，它把客户端发送到redirector数据IP包的目标地址进行了替换。

一、网络环境

一台director + N台realserver，director和realserver在同一个私有网段，director是realserver的默认网关。只有director拥有公共IP，能够暴露在广域网上。

二、客户端请求

客户端请求先到公用IP（director），请求报文中的IP包目标地址被替换成了一个director据负载均衡策略选择的一个realserver的IP。

三、realserver响应
realserver处理完请求生成了返回数据包，返回数据IP包的源地址是realserver的IP地址，目标地址是客户服务端IP地址。因为realserver的默认网关是redirector，所以尽管返回IP数据包的目标地址是客户端的ip地址，返回数据包仍然首先被发回到redirector上。redirector再次实施欺骗，把返回的IP 数据包的源地址改为本身的IP。而后再转发到交换机上返回给客户端。

整个过程redirector的任务是实施了2次IP层欺骗修改，一次是修改了请求数据包得目标地址，此次修改的目的是为了实现数据的负载均衡的分发。另外一次是修改了响应数据包的源地址，目的是为了隐藏realserver，使用户感受不到realserver的存在。

三、限制：整个集群的吞吐量受到redirector的带宽限制（主要是出口带宽）。

LVS-DR：

这个方法的思路是实施数据链路层数据欺骗，修改网络帧数据的Mac地址。
一、网络环境
一台director + N台realserver，director和realserver都拥有公共IP，都暴露在广域网上，此外realserver还有一个和director ip地址同样的ip别名。

也就是说realserver有2个ip，一个真实的ip地址，一个和direcotr地址同样的IP别名（即公用IP），公用IP就是开放给客户端访问的IP地址。
realserver还须要作一个配置，使它们忽略全部的针对公用IP的ARP广播，当系统arp广播询问哪一个mac地址拥有公用IP时，就只有调度服务器会响应，外界发送的数据就不会发给实际服务器。

二、客户端请求
客户端请求先到公用IP（director），因为网络环境已配置为只有director响应过ARP广播，所以请求报文的mac地址会被改成realserver的mac地址。

也就是说redirector实施链路层欺骗，将帧数据的目标mac地址替换成根据负载均衡策略决定的某一realserver的mac地址。

三、realserver响应
realserver收到mac帧，而后将mac帧组装成ip包，发现ip包中的目标地址和本身的ip别名相同，没有问题，继续处理，（这就是要求ip别名相同的缘由，若是不一样，操做系统可能会直接忽略）生成响应数据，发送回去。这时候因为redirector不是默认网关，所以这些数据会直接发到广域网上，广域网会把数据送到客户端。

四、优势：返回数据包无需通过redirector，没有redirector带宽瓶颈。原则上集群的带宽是全部实际服务器带宽之和，固然他们不可能超过链接的广域网交换机的带宽。

五、限制：须要购买多个公共IP，director和realserver必须在同一个 WAN网段，也就是要在同一个交换机上。

为何必定要在同一网段呢？很简单，若是realserver在另一个网段，redirector把整个数据包和mac帧修改完以后再发送到交换机上，交换机发现本身的wan内找不到这个mac地址，没法进行转发。

LVS-TUN：

这个方法是为了突破LVS-DR同一网段内的限制所提出来的。它不作任何欺骗，而是光明正大的交流，在网络层进行了二次包装。

一、网络环境

一台director + N台realserver，director 和realserver都拥有公共IP，都暴露在广域网上。公共ip互不相同，没有别名限制，也无需在同一网段。

二、客户端请求
客户端发送数据到redirector，redirector把IP包做为有效负载放到一个新的IP包中去，并根据调度策略肯定一个特定realserver的ip做为新的IP包得目的地址。这些新的IP包彻底符合网络协议，也没有任何欺骗的勾当，所以这些ip包光明正大得穿过wan网段，达到指定的realserver。

三、realserver响应
realserver拿到数据后，它须要作一个事情，把ip包的有效载荷提取出来，而后把这些载荷再做为ip包组成TCP，再向上组成最后的请求数据。根据请求数据，realserver生成返回数据后，光明正大返回给客户端。

四、优势：和LVS-DR同样，没有redirector出口带宽瓶颈。

五、缺点：须要额外的打包和解包，有必定的开销。

LVS配置

ipvsadm安装

yum -y install ipvsadm

LVS-NAT的配置

一、realserver配置要求：

配置内部私网地址，默认网关指向调度服务器算法

二、Directer配置要求基本配置：服务器

调度服务器须要2块网卡（一块网卡对外，一块网卡对内。1块也能够，配置子接口，对外的VIP和DIP都配置在同一网卡上，不过这样会更加的下降调度器的性能，建议仍是双网卡）网络

关闭selinux和iptables，并打开包转发功能：负载均衡

setenforce 0
service iptables stop

echo "1" > /proc/sys/net/ipv4/ip_forward

（为了不没必要要的麻烦，在每台服务器上都关闭这2个服务）tcp

ipvsadm -A –t $VIP：$Port -s rr

解释：-A表示添加一个集群服务（能够添加多个，好比添加一个web的80和一个https的443）；性能

-t表示是tcp协议；优化

-s表示调度算法是轮询（一共有10种调度算法，能够按照本身实际须要选择）

ipvsadm -a –t $VIP：$Port -r $DIP:$Port -m

解释：-a表示添加一个realserver，后面跟上以前定义的集群服务的地址端口，-r表示增长具体realserver的地址，-m表示模式为NAT模式

LVS-DR的配置

一、Realserver配置要求基本配置

首先先配置限制arp，否则等配置好地址后就产生地址冲突了，经过修改内核参数来实现。

在linux中，默认在接口上通告全部接口上IP的arp广播，在接口上应答全部接口上IP的arp请求

arp_announce 限制arp通告

限制等级

0：在接口上通告全部接口上IP的arp广播

1：对于其它设备的arp请求，在接口上尽可能限制广播通告应答（不够严格）

2：只通告本接口上IP的arp广播

arp_ignore 限制arp应答

限制等级

0：对于其它设备的arp请求，应答全部其它接口的上IP的arp应答

1：对于其它设备的arp请求，只应答本接口上IP的arp应答

echo "1" > /proc/sys/net/ipv4/conf/lo/arp_ignore

echo "2" > /proc/sys/net/ipv4/conf//lo/arp_announce

echo "1" > /proc/sys/net/ipv4/conf/all/arp_ignore

echo "2" > /proc/sys/net/ipv4/conf/all/arp_announce

在realserver上的lo口配置VIP，这样配置就限制了VIP不会在物理交换机上产生MAC地址表，从而避免IP冲突

ifconfig lo:1 $VIP broadcast $VIP netmask 255.255.255.255

ifconfig eth0 $DIP up

注意此VIP的接口的广播地址仍然为VIP，限制其广播，子网掩码是32位，下面调度器上的配置也注意此项

配置特殊路由，使目标为VIP的包的以源地址为VIP的lo口出去

route add –host $VIP dev lo:1

Directer配置要求

配置VIP和DIP，VIP配置在物理网卡的子接口上

ifconfig eth0 $DIP broadcast $VIP netmask 255.255.255.0 up

ifconfig eth0:1 $VIP broadcast $VIP netmask 255.255.255.255 up

配置特殊路由，目标是VIP的包从配置了VIP的物理子接口上出去

route add –host $VIP dev eth0:1

集群配置

ipvsadm -A –t $VIP：$Port-s rr

解释：-A表示添加一个集群服务（这里和NAT中的配置同样）

ipvsadm -a –t $VIP：$Port -r $DIP:$Port-g

解释：其它和NAT也差很少，在最后的模式改成-g，即DR模式

LVS调度算法

-s 指定服务采用的算法，经常使用的算法参数以下：
rr 轮叫（Round Robin）
调度器经过”轮叫”调度算法将外部请求按顺序轮流分配到集群中的真实服务器上，它均等地对待每一台服务器，而无论服务器上实际的链接数和系统负载。

wrr 加权轮叫（Weighted Round Robin）
调度器经过”加权轮叫”调度算法根据真实服务器的不一样处理能力来调度访问请求。这样能够保证处理能力强的服务器处理更多的访问流量。调度器能够自动问询真实服务器的负载状况，并动态地调整其权值。

lc 最少连接（Least Connections）
调度器经过”最少链接”调度算法动态地将网络请求调度到已创建的连接数最少的服务器上。若是集群系统的真实服务器具备相近的系统性能，采用”最小链接”调度算法能够较好地均衡负载。

wlc 加权最少连接（Weighted Least Connections）
在集群系统中的服务器性能差别较大的状况下，调度器采用”加权最少连接”调度算法优化负载均衡性能，具备较高权值的服务器将承受较大比例的活动链接负载。调度器能够自动问询真实服务器的负载状况，并动态地调整其权值。

lblc 基于局部性的最少连接（Locality-Based Least Connections）
“基于局部性的最少连接”调度算法是针对目标IP地址的负载均衡，目前主要用于Cache集群系统。该算法根据请求的目标IP地址找出该目标IP地址最近使用的服务器，若该服务器是可用的且没有超载，将请求发送到该服务器；若服务器不存在，或者该服务器超载且有服务器处于一半的工做负载，则用”最少连接” 的原则选出一个可用的服务器，将请求发送到该服务器。

lblcr 带复制的基于局部性最少连接（Locality-Based Least Connections with Replication）
”带复制的基于局部性最少连接”调度算法也是针对目标IP地址的负载均衡，目前主要用于Cache集群系统。它与LBLC算法的不一样之处是它要维护从一个目标IP地址到一组服务器的映射，而LBLC算法维护从一个目标IP地址到一台服务器的映射。该算法根据请求的目标IP地址找出该目标IP地址对应的服务器组，按”最小链接”原则从服务器组中选出一台服务器，若服务器没有超载，将请求发送到该服务器，若服务器超载；则按”最小链接”原则从这个集群中选出一台服务器，将该服务器加入到服务器组中，将请求发送到该服务器。同时，当该服务器组有一段时间没有被修改，将最忙的服务器从服务器组中删除，以下降复制的程度。

dh 目标地址散列（Destination Hashing）
“目标地址散列”调度算法根据请求的目标IP地址，做为散列键（Hash Key）从静态分配的散列表找出对应的服务器，若该服务器是可用的且未超载，将请求发送到该服务器，不然返回空。

sh 源地址散列（Source Hashing）“源地址散列”调度算法根据请求的源IP地址，做为散列键（Hash Key）从静态分配的散列表找出对应的服务器，若该服务器是可用的且未超载，将请求发送到该服务器，不然返回空。