一、技术架构
二、LVS技术特色linux

三、Tengine技术特色
四、更多功能
ios

SLB（Server Load Balancer）服务经过设置虚拟服务地址（IP），将位于同一地域（Region）的多台云服务器（Elastic Compute Service，简称ECS）资源虚拟成一个高性能、高可用的应用服务池；再根据应用指定的方式，未来自客户端的网络请求分发到云服务器池中。nginx

SLB服务会检查云服务器池中ECS的健康状态，自动隔离异常状态的ECS，从而解决了单台ECS的单点问题，同时提升了应用的总体服务能力。在标准的负载均衡功能以外，SLB服务还具有TCP与HTTP抗DDoS攻击的特性，加强了应用服务器的防御能力。git

SLB服务是ECS面向多机方案的一个配套服务，须要同ECS结合使用。github

一、技术架构

整个负载均衡系统由3部分构成：四层负载均衡、七层负载均衡和控制系统，以下图所示：web

四层负载均衡
采用开源软件LVS（Linux Virtual Server）构建，并根据云计算需求对其进行了定制和优化。
七层负载均衡
采用开源软件Tengine构建。
控制系统
用于配置和监控负载均衡系统。

二、LVS技术特色

LVS是全球最流行的四层负载均衡开源软件，能够实现LINUX平台下的负载均衡。算法

LVS是基于Linux Netfilter框架实现的一个内核模块（ IPTables是基于Netfilter基本架构实现的一个可扩展的数据报高级管理系统或核外配置工具），名称为IPVS。其钩子函数分别HOOK在LOCAL_IN和FORWARD两个HOOK点，以下图所示：

在云计算大规模网络环境下，官方LVS存在以下问题：

问题1：LVS支持NAT/DR/TUNNEL三种转发模式，上述模式在多VLAN网络环境下部署时，存在网络拓扑复杂，运维成本高的问题。
问题2：和商用负载均衡设备（如F5等）相比，LVS缺乏DDOS攻击防护功能。
问题3：LVS采用PC服务器，经常使用Keepalived软件的VRRP心跳协议进行主备部署，其性能没法扩展。
问题4：LVS经常使用管理软件Keepalived的配置和健康检查性能不足。

为了解决上述问题， SLB在官方LVS基础上进行了以下定制化和优化：

解决1：新增转发模式FULLNAT，实现LVS-RealServer间跨VLAN通信。
解决2：新增了SYNPROXY等TCP标志位DDOS攻击防护功能。
解决3：采用LVS集群方式部署。
解决4：对Keepalived的性能进行了优化。

Aliyun-LVS开源地址： https://github.com/alibaba/LVS 。更多相关说明以下所述。

FULLNAT技术概述

以下图所示，FULLNAT主要实现方式为：

引入local address（内网IP地址）。cip-vip转换为lip->rip，而 lip和rip均为IDC内网IP，能够跨VLAN通信。
IN/OUT的数据流所有通过LVS，为了保证带宽，采用万兆（10G）网卡。
FULLNAT转发模式，当前仅支持TCP协议。

SYNPROXY技术概述

LVS针对TCP标志位DDOS攻击，采起以下策略：

对于SYN flood类型攻击，利用SYNPROXY模块进行防护。

以下图所示，主要实现方式为：参照Linux TCP协议栈中SYN cookie的思想，LVS代理TCP三次握手。代理过程：

1) Client发送SYN包给LVS。

2) LVS构造特殊SEQ的SYN ACK包给Client。

3) Client回复ACK给LVS。

4) LVS验证ACK包中ack_seq是否合法。

5) 若是合法，则LVS再和Realserver创建3次握手。

对于ACK/FIN/RSTFlood类型攻击，查找链接表，若是不存在，则直接丢弃。

集群部署方式

LVS集群部署方式实现的主要方式为：

LVS和上联交换机间运行OSPF协议。
上联交换机经过ECMP等价路由，将数据流分发给LVS集群。
LVS集群再转发给业务服务器。

集群方式部署极大的保证了异常状况下，负载均衡服务的稳定性：

健壮性
LVS和交换机间运行OSPF心跳。1个VIP配置在集群的全部LVS上。当一台LVS down，交换机会自动发现并将其从ECMP等价路由中剔除。
可扩展
若是当前LVS集群没法支撑某个VIP的流量，LVS集群能够进行水平扩容。

Keepalived优化

阿里云在SLB中针对LVS管理软件Keepalived进行了全面优化，主要包括：

优化了网络异步模型，select方式改成epoll方式。
优化了reload过程。

综上所述，基于LVS的SLB四层负载均衡产品具备以下特色；

高可用：LVS集群保证了冗余性，无单点。
安全：LVS自带攻击防护+云盾，提供了接近于实时防护的能力。
健康检查：SLB对后端ECS进行健康检查，自动屏蔽异常状态的ECS，待该ECS恢复正常后自动解除屏蔽。

三、Tengine技术特色

Tengine是阿里巴巴发起的WEB服务器项目，其在Nginx的基础上，针对大访问量网站的需求，添加了不少高级功能和特性是当前最流行的7层负载均衡开源软件之一。Tengine的性能和稳定性已经在大型的网站如淘宝网，天猫商城等获得了很好的检验。它的最终目标是打造一个高效、稳定、安全、易用的Web平台。

注：Tengine开源地址http://tengine.taobao.org/。

针对云计算场景，Tengine定制的主要特性以下：

继承Nginx-1.4.6的全部特性，100%兼容Nginx的配置。
动态模块加载（DSO）支持。加入一个模块再也不须要从新编译整个Tengine。
更增强大的负载均衡能力，包括一致性Hash模块、会话保持模块，还能够对后端的服务器进行主动健康检查，根据服务器状态自动上线下线。
监控系统的负载和资源占用从而对系统进行保护。
对运维人员更友好的出错信息，便于定位出错机器。
更强大的防攻击（访问速度限制等）模块。

采用Tengine做为SLB的基础模块的阿里云SLB七层负载均衡产品，具备以下特色：

高可用：Tengine集群保证了冗余性，无单点。
安全：多维度的CC攻击防护能力。
健康检查：SLB对后端ECS进行健康检查，自动屏蔽异常状态的ECS，待该ECS恢复正常后自动解除屏蔽。
会话保持：支持7层会话保持功能。
一致性：支持一致性hash调度。

四、更多功能

SLB做为负载均衡设备，其最重要的指标是【稳定性】，在进一步提升稳定性方面，主要工做包括：

支持集群内部 session同步。
采用Anycast技术实现同城双A。

在功能方面有更多支持，包括：

白名单访问控制
从SLB层面实现访问控制，用户能够在SLB系统上配置白名单，便于用户灵活限定外部访问请求。
更多服务协议的支持
当前已经支持HTTPS、UDP。

四层和七层负载均衡的区别

　　首先简单介绍一下LVS (Linux Virtual Server)究竟是什么东西，其实它是一种集群(Cluster)技术，采用IP负载均衡技术和基于内容请求分发技术。调度器具备很好的吞吐率，将请求均衡地转移到不一样的服务器上执行，且调度器自动屏蔽掉服务器的故障，从而将一组服务器构成一个高性能的、高可用的虚拟服务器。整个服务器集群的结构对客户是透明的，并且无需修改客户端和服务器端的程序。

　　为此，在设计时须要考虑系统的透明性、可伸缩性、高可用性和易管理性。通常来讲，LVS集

　　负载调度器(load balancer/ Director)，它是整个集群对外面的前端机，负责将客户的请求发送到一组服务器上执行，而客户认为服务是来自一个IP地址(咱们可称之为虚拟IP地址)上的。

　　服务器池(server pool/ Realserver)，是一组真正执行客户请求的服务器，执行的服务通常有WEB、MAIL、FTP和DNS等。

　　共享存储(shared storage)，它为服务器池提供一个共享的存储区，这样很容易使得服务器池拥有相同的内容，提供相同的服务。

　　VS/NAT是一种最简单的方式，全部的RealServer只须要将本身的网关指向Director便可。客户端能够是任意操做系统，但此方式下，一个Director可以带动的RealServer比较有限。在VS/NAT的方式下，Director也能够兼为一台RealServer。VS/NAT的体系结构如图所示。

　　IP隧道(IP tunneling)是将一个IP报文封装在另外一个IP报文的技术，这能够使得目标为一个IP地址的数据报文能被封装和转发到另外一个IP地址。IP隧道技术亦称为IP封装技术(IP encapsulation)。IP隧道主要用于移动主机和虚拟私有网络(Virtual Private Network)，在其中隧道都是静态创建的，隧道一端有一个IP地址，另外一端也有惟一的IP地址。它的链接调度和管理与VS/NAT中的同样，只是它的报文转发方法不一样。调度器根据各个服务器的负载状况，动态地选择一台服务器，将请求报文封装在另外一个IP报文中，再将封装后的IP报文转发给选出的服务器;服务器收到报文后，先将报文解封得到原来目标地址为 VIP 的报文，服务器发现VIP地址被配置在本地的IP隧道设备上，因此就处理这个请求，而后根据路由表将响应报文直接返回给客户。

　　VS/DR方式是经过改写请求报文中的MAC地址部分来实现的。Director和RealServer必需在物理上有一个网卡经过不间断的局域网相连。 RealServer上绑定的VIP配置在各自Non-ARP的网络设备上(如lo或tunl),Director的VIP地址对外可见，而RealServer的VIP对外是不可见的。RealServer的地址便可以是内部地址，也能够是真实地址。

　　VS/DR的工做流程如图所示：它的链接调度和管理与VS/NAT和VS/TUN中的同样，它的报文转发方法又有不一样，将报文直接路由给目标服务器。在VS/DR中，调度器根据各个服务器的负载状况，动态地选择一台服务器，不修改也不封装IP报文，而是将数据帧的MAC地址改成选出服务器的MAC地址，再将修改后的数据帧在与服务器组的局域网上发送。由于数据帧的MAC地址是选出的服务器，因此服务器确定能够收到这个数据帧，从中能够得到该IP报文。当服务器发现报文的目标地址VIP是在本地的网络设备上，服务器处理这个报文，而后根据路由表将响应报文直接返回给客户。

　　VS/NAT 的优势是服务器能够运行任何支持TCP/IP的操做系统，它只须要一个IP地址配置在调度器上，服务器组能够用私有的IP地址。缺点是它的伸缩能力有限，当服务器结点数目升到20时，调度器自己有可能成为系统的新瓶颈，由于在VS/NAT中请求和响应报文都须要经过负载调度器。咱们在Pentium166 处理器的主机上测得重写报文的平均延时为60us，性能更高的处理器上延时会短一些。假设TCP报文的平均长度为536 Bytes，则调度器的最大吞吐量为8.93 MBytes/s. 咱们再假设每台服务器的吞吐量为800KBytes/s，这样一个调度器能够带动10台服务器。(注：这是很早之前测得的数据)

　　基于 VS/NAT的的集群系统能够适合许多服务器的性能要求。若是负载调度器成为系统新的瓶颈，能够有三种方法解决这个问题：混合方法、VS/TUN和 VS/DR。在DNS混合集群系统中，有若干个VS/NAT负调度器，每一个负载调度器带本身的服务器集群，同时这些负载调度器又经过RR-DNS组成简单的域名。

　　对于那些将IP地址或者端口号在报文数据中传送的网络服务，须要编写相应的应用模块来转换报文数据中的IP地址或者端口号。这会带来实现的工做量，同时应用模块检查报文的开销会下降系统的吞吐率。

　　在VS/TUN 的集群系统中，负载调度器只将请求调度到不一样的后端服务器，后端服务器将应答的数据直接返回给用户。这样，负载调度器就能够处理大量的请求，它甚至能够调度百台以上的服务器(同等规模的服务器)，而它不会成为系统的瓶颈。即便负载调度器只有100Mbps的全双工网卡，整个系统的最大吞吐量可超过 1Gbps。因此，VS/TUN能够极大地增长负载调度器调度的服务器数量。VS/TUN调度器能够调度上百台服务器，而它自己不会成为系统的瓶颈，能够用来构建高性能的超级服务器。VS/TUN技术对服务器有要求，即全部的服务器必须支持“IP Tunneling”或者“IP Encapsulation”协议。目前，VS/TUN的后端服务器主要运行Linux操做系统，咱们没对其余操做系统进行测试。由于“IP Tunneling”正成为各个操做系统的标准协议，因此VS/TUN应该会适用运行其余操做系统的后端服务器。

　　跟VS/TUN方法同样，VS/DR调度器只处理客户到服务器端的链接，响应数据能够直接从独立的网络路由返回给客户。这能够极大地提升LVS集群系统的伸缩性。跟VS/TUN相比，这种方法没有IP隧道的开销，可是要求负载调度器与实际服务器都有一块网卡连在同一物理网段上，服务器网络设备(或者设备别名)不做ARP响应，或者能将报文重定向(Redirect)到本地的Socket端口上。

　　注：以上三种方法所能支持最大服务器数目的估计是假设调度器使用100M网卡，调度器的硬件配置与后端服务器的硬件配置相同，并且是对通常Web服务。使用更高的硬件配置(如千兆网卡和更快的处理器)做为调度器，调度器所能调度的服务器数量会相应增长。当应用不一样时，服务器的数目也会相应地改变。因此，以上数据估计主要是为三种方法的伸缩性进行量化比较。

　　◆最少的链接方式(Least Connection)：传递新的链接给那些进行最少链接处理的服务器。当其中某个服务器发生第二到第7 层的故障，BIG-IP 就把其从服务器队列中拿出，不参加下一次的用户请求的分配, 直到其恢复正常。

　　◆最快模式(Fastest)：传递链接给那些响应最快的服务器。当其中某个服务器发生第二到第7 层的故障，BIG-IP 就把其从服务器队列中拿出，不参加下一次的用户请求的分配，直到其恢复正常。

　　◆观察模式(Observed)：链接数目和响应时间以这两项的最佳平衡为依据为新的请求选择服务器。当其中某个服务器发生第二到第7 层的故障，BIG-IP就把其从服务器队列中拿出，不参加下一次的用户请求的分配，直到其恢复正常。

　　◆预测模式(Predictive)：BIG-IP利用收集到的服务器当前的性能指标，进行预测分析，选择一台服务器在下一个时间片内，其性能将达到最佳的服务器相应用户的请求。(被BIG-IP 进行检测)

　　◆动态性能分配(Dynamic Ratio-APM):BIG-IP 收集到的应用程序和应用服务器的各项性能参数，动态调整流量分配。

　　◆动态服务器补充(Dynamic Server Act.):当主服务器群中因故障致使数量减小时，动态地将备份服务器补充至主服务器群。

　　◆服务类型(ToS): 按不一样的服务类型(在Type of Field中标识)负载均衡对数据流进行分配。

　　◆规则模式：针对不一样的数据流设置导向规则，用户可自行

分享阿里云SLB-负载均衡的实现基本原理架构

负载均衡技术原理浅析

一、技术架构

二、LVS技术特色

FULLNAT技术概述

SYNPROXY技术概述

集群部署方式

Keepalived优化

三、Tengine技术特色

四、更多功能

四层和七层负载均衡的区别

LVS：三种负载均衡方式比较