LVS详解

LVS概述html

一、LVS(Linux Virtual Server)Linux虚拟服务器:是一个虚拟的服务器集群系统。本项目在1998年5月有章文嵩博士成立,是中国国内最先出现的自由软件项目之一。经过LVS提供的负载均衡技术和Linux操做系统可实现一个高性能、高可用的服务器集群,从而以低成本实现最优的服务性能。前端

二、集群简介:集群(Cluster)是一组相互独立的、经过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理。一个客户与集群相互做用时,集群像是一个独立的服务器。集群配置是用于提升可用性和可缩放性。集群系统的主要优势:高可扩展性、高可用性、高性能、高性价比。node

三、集群类型算法

    LB:Load Balancing 高可拓展,伸缩集群后端

    HA :High Availability 高可用集群bash

    HP:High Performance 高性能集群服务器

LVS详解
网络

1、LVS组成:LVS其实由两个组件组成,在用户空间的ipvsadm和内核空间的ipvs,ipvs工做于INPUT链上,若是有请求报文被ipvs事先定义,就会将请求报文直接截取下根据其特定的模型修改请求报文,再转发到POSTROUTING链上送出TCP/IP协议栈。session

wKioL1egQXnwMOIaAAGE09659_8970.png

2、LVS的实现模型:LVS在不一样场景中提供了4种实现模型:分别是NAT,DR,TUN,FULLNAT并发

一、NAT工做模式

实现原理:NAT模型其实就是一个多路的DNAT,客户端对VIP进行请求,Director经过事先指定好的调度算法计算出应该转发到那台RS上,并修改请求报文的目标地址为RIP,经过DIP送往RS。当RS响应客户端报文给CIP,在通过Director时,Director又会修改源地址为VIP并将响应报文发送给客户端,这段过程对于用户来讲是透明的。

NAT特性:

1)RS和Director必需要在同一个IP网段中。

2)RS的网关必须指向DIP

3)能够实现端口映射

4)请求报文和响应报文都会通过Director

5)RS能够是任意OS

6)DIP和RIP只能是内网IP

wKioL1eiuDXybGCRAABXr1zmtqQ740.jpg

NAT工做流程:

1)客户端将请求发送前端的负载均衡器,请求报文源地址是CIP(客户端IP),目标地址为VIP(负载均衡器前端地址);

2)负载均衡器收到报文后,发现请求的是在规则里面存在的地址,作DNAT,把目标IP转换为任意后端RS的RIP,而后发送到后端服务器。

3)报文送到Real Server,进行响应,响应报文源IP为RIP,目标IP仍是CIP,可是网关指向DIP。

4)Dirctor接收到响应报文后,自动进行源地址转换,把RIP转换为VIP,发往互联网,到达客户端。

二、DR工做模式

DR模型是一个比较复杂的模型,由于VIP在Director和每个RS上都存在,客户端对VIP(Director)请求时,Director接收到请求,会将请求报文的源MAC地址和目标MAC地址修改成本机DIP所在网卡的MAC地址和指定的RS的RIP所在网卡的MAC地址,RS接收到请求报文后直接对CIP发出响应报文,而不须要通过Director。

DR特性:

1)RS和Director能够不在同一IP网段中,可是必定要在同一物理网络中。(最好同一网段)

2)RS可使用公网地址,此时能够直接经过互联网连入,配置监控RS服务器。

3)RS的网关必定不能指向Director。

4)客户端请求报文必须通过Director,可是响应报文必定不能经过Director。

5)不能实现端口映射。

6)RS能够是大部分操做系统。

DR模型的问题(客户请求VIP怎么到达Director):

1)网络设备(路由器)中设置VIP地址和Director的MAC地址进行绑定。(前提:路由器的配置权限;缺点:Director故障转移,没法更新此绑定;)

2)arptables(前提:在各RS安装arptables程序,并编写arptables规则;缺点:依赖于独特功能的应用程序;)

3)修改Linux内核参数,arp_ignore,arp_announce(前提:RS必须是Linux;缺点:适用性差;)

 两个参数的取值含义:

    arp_announce:定义通告模式

            0:default,只要主机接入网络,则自动通告全部网卡MAC地址。

            1:尽力不通告非直接连入网络的网卡MAC地址。

            2:只通告直接进入网络的网卡MAC地址。

    arp_ignore:定义收到arp请求时的响应模式                        

            0:只有arp广播请求,立刻响应,而且响应全部本机网卡的mac地址。

            1:只响应,接受arp广播请求的网卡接口mac地址。

            2:只响应,接受arp广播请求的网卡接口mac地址,而且须要请求广播于接口地址属于同一网段。

            3:主机范围(Scope host)内生效的接口,不予响应,只响应全局生效于外网能通讯的网卡接口。

            4-7:保留位

            8:不响应一切arp广播请求。

wKioL1eiuMWSEYKnAABfKXT-jdg063.jpg

DR工做流程:

DR模型,当RIP,DIP,VIP所有为公网地址时:

1)客户端对VIP发送请求。

2)Director接收请求,发现是请求后端的集群服务,而后对后端集群RIP发起ARP请求。

3)Director获得后方RS的MAC地址后,选择一个把请求经过MAC地址发送给后端服务器。

4)RS接收到请求后,进行响应,使用隐藏的VIP进行封装报文,但使用RIP所在网卡进行向外发送。

5)RS发出的响应报文因为是使用VIP隐藏网卡封装,所以源IP为VIP,目标IP为CIP,因此报文直接发往互联网路由器,到达客户端。

DR模型,当RIP,DIP,VIP所有为私有地址时:

1)客户端对VIP发送请求。

2)Director接收请求,发现是请求后端集群服务,而后对后端集群RIP发起ARP请求。

3)Director获得后方RS的MAC地址后,如今一个把请求经过MAC地址发送给后端服务器。

4)RS接收到请求后,进行响应,使用隐藏的VIP网卡进行封装报文,但使用RIP所在网卡进行向外发送。

5)RS发出的响应报文因为是使用VIP隐藏网卡封装,所以源IP为VIP,目标IP为CIP。

6)因为RS的通讯RIP地址为私有地址,所以网关须要指向并发往转发服务器同网段地址网卡。

7)转发服务器将响应报文发往互联网,最终到达客户端。

三、TUN:IP隧道,IP报文中套IP报文

TUN模型经过隧道的方式在公网中实现请求报文的转发,客户端请求VIP(Director),Director不修改请求报文的源IP和目标IP,而是在IP首部前附加DIP和对应的RIP地址并转发到RIP上,RS收到请求报文,RS的本地接口上也有VIP,遂直接响应报文给CIP。

TUN特性

1)RIP,DIP,VIP都必须是公网地址。

2)RS网关不会指向DIP。

3)请求报文必须通过Director,但响应报文必定不通过Director。

4)不支持端口映射。

5)RS的OS(操做系统)必须得支持隧道功能。

wKiom1eiuNOwSGRfAABi8Ue00Oc447.jpg

TUN模型,一般为异地容灾策略:

1)客户端对VIP发送请求。

2)Director接收请求,发现是请求后端集群服务,因为和RS在异地网络,所以在原请求报文的基础上,在加上一层,源IP为DIP,目标IP为RIP的层。

3)Director将加了包装的报文发往互联网,互联网路由将TUN报文路由发往响应的RS。

4)RS接收到请求后,拆掉外出IP首部,发现里面还有一层IP首部,而且目标地址为本身的VIP,所以接收报文并响应。

5)RS经过隐藏VIP包装响应报文,目标IP仍然是原CIP。

6)RS将响应报文发往互联网路由器,并最终路由至客户端。

四、FullNAT:NAT的加强版

FULLNAT是最近几年才出现的,客户端请求VIP(Director),Director修改请求报文的源地址(DIP)和目标地址(RIP)并转发给RS,FULLNAT模型通常是Director和RS处于复杂的内网环境中的实现。

FULLNAT特性:

1)VIP是公网地址,DIP和RIP是内网地址,可是无需在同一网络中。

2)请求报文须要通过Director,响应报文也要通过Director。

3)RIP接收到的请求报文的源地址为DIP,目标地址为RIP。

4)支持端口映射。

5)RS能够是任意的OS(操做系统)。

wKioL1ei0aqycTbtAADmPDSGm14147.png

3、LVS的调度算法

静态方法:仅根据调度算法自己进行调度

rr:round robin,轮流,轮训,轮叫,轮调
wrr:weighted round robin,增强轮询
sh:source hashing,session绑定
dh:destination hashing,目标地址hash

动态方法:根据算法及各RS当前的负载情况进行调度

lc:least connection,最少链接
wlc:weighted lc,加权最少链接
sed:shortest expection delay,最少指望延迟
nq:never queue,永不排队
lblc:Locality-Based Least Connection,基于局部性的最少链接
lblcr:Replicated lblc,基于局部性的带复制功能的最少链接

LVS缺陷:不能检查后端服务器的健康状况,老是发送链接到后端。

session持久机制:

一、session绑定:始终将同一个请求者的链接定向至同一个RS(第一次请求时仍由调度方法选择);没有容错能力,有损负载均衡效果。

二、session复制:在RS之间同步session,所以,每一个RS中都有集群中全部的session;对于大规模集群环境不适用。

三、session服务器:利用单独部署的服务器来同一管理session。

4、LVS使用方法(ipvsadm)

命令格式:
ipvsadm -A|E -t|u|f service-address [-s scheduler]
              [-p [timeout]] [-M netmask]
      ipvsadm -D -t|u|f service-address
      ipvsadm -C
      ipvsadm -R
      ipvsadm -S [-n]
      ipvsadm -a|e -t|u|f service-address -r server-address
              [-g|i|m] [-w weight] [-x upper] [-y lower]
      ipvsadm -d -t|u|f service-address -r server-address
      ipvsadm -L|l [options]
      ipvsadm -Z [-t|u|f service-address]
      ipvsadm --set tcp tcpfin udp
      ipvsadm --start-daemon state [--mcast-interface interface]
              [--syncid syncid]
      ipvsadm --stop-daemon state
      ipvsadm -h
      
命令详解:
    定义集群服务:
        -A 添加一个集群服务
        -D -t|u|f service-address:删除指定的集群服务 
        -E 修改一个集群服务
        -t VIP:端口 定义集群服务的类型为TCP的某个端口
        -u VIP:端口 定义集群服务的类型为UDP的某个端口
        -f 防火墙标记 定义集群服务的类型为防火墙标记
        -s 调度算法 指定集群服务的调度算法 
        -p timeout:persistent connection,持久链接
    定义集群节点:
        -a 添加一个节点到集群服务
            -t|-u|-f service-address:指明将RS添加至那个Cluster-service中
            -r:指定RS,可包含{IP[:port]},只有支持端口映射的lvs类型才能使用跟集群服务中不一样的端口
        -d 从集群服务中删除一个节点
        -e 修改集群服务器中的节点
        -r 节点IP:端口  定义节点的IP及类型
        -m 定义为NAT模型
        -g 定义为DR模型
        -i 定义为TUN模型
        -w 权重 定义服务器的权重
    查看已经定义的集群服务及RS:
        ipvsadm -L [options]
                -c:查看各链接
                -n:数字格式显示IP地址
                --stats: 显示统计数据
                --rate: 速率
                --exact: 显示统计数据的精确值
                --timeout:超时时间
             -Z:计数器清零;
    从集群服务中删除RS:
        ipvsadm -d -t|u|f service-address -r server-address
    删除集群服务:
        ipvsadm -D -t|u|f service-address
    清空全部的集群服务:
        ipvsadm -C 
    保存集群服务定义:
        ipvsadm -S > /path/to/some_rule_file
        ipvsadm-save > /path/to/some_rule_file
    让规则文件中的规则生效:
        ipvsadm -R < /path/from/some_rule_file
        ipvsadm-restore < /path/from/some_rule_file

5、LVS各类模型的实现

一、LVS NAT模型的实现

一、集群环境,一台Director,两台后端Real server RS1,RS2
    Director:两张网卡
        eth0:192.168.120.100/24     #VIP地址
        eth1:172.16.10.1/16
    RS1:   eth1:172.16.10.11/16
    RS2:   eth1:172.16.10.12/16
    Director的eth1和RS1,RS2的eth1模拟在同一网络,使用物理机
    Windows7做为客户端在192.168.120.0/24网段中
二、为RS添加网关指向Director
    RS1:
        # ifconfig eth1 172.16.10.11/16 up
        # route add default gw 172.16.10.1
    RS2:
        # ifconfig eth1  172.16.10.12/16 up
        # route add default gw 172.16.10.1
三、修改内核参数,开启转发功能
    # echo 1 > /proc/sys/net/ipv4/ip_forward
四、在RS1和RS2上分别建立测试页,并在Director验证服务
    [root@node2 ~]# echo node2.bjwf.com > /var/www/html/index.html
    [root@node2 ~]# systemctl start httpd.service
    [root@node3 ~]# echo node3.bjwf.com > /var/www/html/index.html
    [root@node3 ~]# systemctl start httpd.service
    Director上验证:
    [root@node1 ~]# curl http://172.16.10.11
    node2.bjwf.com
    [root@node1 ~]# curl http://172.16.10.12
    node3.bjwf.com
五、在Director添加集群服务
    [root@node1 ~]# yum -y install ipvsadm    #安装集群管理软件
    # ipvsadm -A -t 192.168.120.210:80 -s rr
    # ipvsadm -a -t 192.168.120.210:80 -r 172.16.10.11:80 -m -w 1
    # ipvsadm -a -t 192.168.120.210:80 -r 172.16.10.12:80 -m -w 1

二、LVS DR模型的实现

一、集群环境,一台Director,两台后端Real server RS1,RS2
    Director:    eth0:192.168.120.100/24  
       配置VIP:ifconfig eth0:0 192.168.120.110 netmask 255.255.255.255 broadcast 192.168.120.110
    RS1:       eth0:192.168.120.211/24  
    RS2:       eth0:192.168.120.212/24  
    VIP:          192.168.120.100
二、修改RS1,RS2的内核参数,关闭lo的arp通告和lo的arp响应,并配置隐藏地址
    # echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce
    # echo 2 > /proc/sys/net/ipv4/conf/lo/arp_announce
    # echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore 
    # echo 1 > /proc/sys/net/ipv4/conf/lo/arp_ignore
    # ifconfig lo:1 192.168.120.100 netmask 255.255.255.255 broadcast 192.168.120.100
三、在RS1和RS2上分别建立测试页,并在Director验证服务
    [root@node2 ~]# echo node2.bjwf.com > /var/www/html/index.html
    [root@node2 ~]# systemctl start httpd.service
    [root@node3 ~]# echo node3.bjwf.com > /var/www/html/index.html
    [root@node3 ~]# systemctl start httpd.service
    Director上验证:
    [root@node1 ~]# curl http://192.168.120.101
    node2.bjwf.com
    [root@node1 ~]# curl http://192.168.120.102
    node3.bjwf.com
四、为RS1和RS2添加路由条目,保证其发出报文通过eth0以前,还要进过lo:0,保证源地址为VIP
    # route add 192.168.120.110 dev lo:1
五、在Director添加集群服务
    # ipvsadm -A -t 192.168.120.110:80 -s rr
    # ipvsadm -a -t 192.168.120.110:80 -r 192.168.120.101:80 -g -w 1
    # ipvsadm -a -t 192.168.120.110:80 -r 192.168.120.102:80 -g -w 1
相关文章
相关标签/搜索