原创做品,容许转载,转载时请务必以超连接形式标明文章 原始出处 、做者信息和本声明。不然将追究法律责任。http://wangzan18.blog.51cto.com/8021085/1725517算法
1、Keepalived介绍
服务器
Keepalived是Linux下一个轻量级的高可用解决方案,它与Heartbeat、RoseHA实现的功能相似,均可以实现服务或者网络的高可用,单是又有差异,Heartbeat是一个专业的、功能完善的高可用软件,它提供了HA软件所需的基本功能,好比心跳检测和资源接管,监测集群中的系统服务,在集群节点间转移共享IP地址的全部者等,Heartbeat功能强大,可是部署和使用相对比较麻烦;与Heartbeat相比,Keepalived主要是经过虚拟路由冗余来实现高可用功能,虽然它没有Heartbeat功能强大,但Keepalived部署和使用很是简单,全部配置只需一个配置文件便可完成。网络
2、Keepalived是什么app
Keepalived起初是为LVS设计的,专门用来监控集群中各个服务节点的状态。它根据TCP/IP参考模型的第3、第四和第五层交换机制检测每一个服务节点的状态,若是某个服务节点出现异常,或工做出现故障,Keepalived将检测到,并将出现故障的服务节点从集群系统中剔除,而在故障节点恢复正常后,Keepalived又能够自动将此服务节点从新加入服务器集群中,这些工做所有自动完成,不须要人工干涉,须要人工完成的只是修复出现故障的服务节点。负载均衡
Keepalived后来又加入了VRRP的功能,VRRP(VirtualRouterRedundancyProtocol,虚拟路由冗余协议)出现的目的是解决静态路由出现的单点故障问题,经过VRRP能够实现网络不间断稳定运行。所以Keepalived一方面具备服务器状态检测和故障隔离功能,另外一方面也具备HA cluster功能。框架
3、VRRP协议与工做原理ide
一、协议模块化
VRRP协议是为消除在静态缺省路由环境下的缺省路由器单点故障引发的网络失效而设计的主备模式的协议,使得在发生故障而进行设备功能切换时能够不影响内外数据通讯,不须要再修改内部网络的网络参数。VRRP协议须要具备IP地址备份,优先路由选择,减小没必要要的路由器间通讯等功能。工具
VRRP协议将两台或多台路由器设备虚拟成一个设备,对外提供虚拟路由器IP(一个或多个),而在路由器组内部,若是实际拥有这个对外IP的路由器若是工做正常的话就是MASTER,或者是经过算法选举产生,MASTER实现针对虚拟路由器IP的各类网络功能,如ARP请求,ICMP,以及数据的转发等;其余设备不拥有该IP,状态是BACKUP,除了接收MASTER的VRRP状态通告信息外,不执行对外的网络功能。当主机失效时,BACKUP将接管原先MASTER的网络功能。性能
配置VRRP协议时须要配置每一个路由器的虚拟路由器ID(VRID)和优先权值,使用VRID将路由器进行分组,具备相同VRID值的路由器为同一个组,VRID是一个0~255的正整数;同一组中的路由器经过使用优先权值来选举MASTER,优先权大者为MASTER,优先权也是一个0~255的正整数。
VRRP协议使用多播数据来传输VRRP数据,VRRP数据使用特殊的虚拟源MAC地址发送数据而不是自身网卡的MAC地址,VRRP运行时只有MASTER路由器定时发送VRRP通告信息,表示MASTER工做正常以及虚拟路由器IP(组),BACKUP只接收VRRP数据,不发送数据,若是必定时间内没有接收到MASTER的通告信息,各BACKUP将宣告本身成为MASTER,发送通告信息,从新进行MASTER选举状态。
二、MASTER选举
若是对外的虚拟路由器IP就是路由器自己配置的IP地址的话,该路由器始终都是MASTER;不然若是不具有虚拟IP的话,将进行MASTER选举,各路由器都宣告本身是MASTER,发送VRRP通告信息;若是收到其余机器的发来的通告信息的优先级比本身高,将转回BACKUP状态;若是优先级相等的话,将比较路由器的实际IP,IP值较大的优先权高;不过若是对外的虚拟路由器IP就是路由器自己的IP的话,该路由器始终将是MASTER,这时的优先级值为255。
4、Keepalived体系结构
keepalived也是模块化设计,不一样模块复杂不一样的功能,下面是keepalived的组件
core:是keepalived的核心,复杂主进程的启动和维护,全局配置文件的加载解析等
check:负责healthchecker(健康检查),包括了各类健康检查方式,以及对应的配置的解析包括LVS的配置解析
vrrp:VRRPD子进程,VRRPD子进程就是来实现VRRP协议的
libipfwc:iptables(ipchains)库,配置LVS会用到
libipvs*:配置LVS会用到
注意,keepalived和LVS彻底是两码事,只不过他们各负其责相互配合而已。
Keepalived的体系结构从总体上分为两层,分别是用户空间层(User Space)和内核空间层(Kernel Space)。
内核空间层处于最底层,它包括IPVS和NETLINK两个模块。IPVS模块是Keepalived引入的一个第三方模块,经过IPVS能够实现基于IP的负载均衡集群,IPVS默认包含在LVS集群软件中。在LVS集群中,IPVS能够安装在一台叫作Director Server的服务器上,同时Director Server上虚拟出一个IP地址对外提供服务,而用户必须经过这个虚拟IP地址才能访问服务。这个虚拟IP通常称为LVS的VIP,访问的请求首先通过VIP到达Director Server,而后由Director Server从服务器集群节点中选取一个服务节点响应用户的请求。
NETLINK模块主要用于实现一些高级路由框架和一些相关的网络功能,完成用户空间层Netlink Reflector模块发来的各类网络请求。
在用户空间层,Keepalived又分为4个部分,分别是Scheduler I/O Multiplexer、Memory Management、Control Plane和Core components。
Scheduler I/O Multiplexer:是一个I/O复用分发调度器,它负责安排Keepalived因此内部的任务请求。
Memory Management:是一个内存管理机制,这个框架提供了访问内存的一些通用方法。
Control Plane:是Keepalived的控制面板,能够实现对配置文件进行编译和解析,Keepalived的配置文件解析比较特殊,它并非一次解析因此模块的配置,而是只有用到某模块时才解析相应的配置。
Core components:这部分是Keepalived的核心组件,包含了一系列功能模块,主要有WatchDog、Checkers、VRRP Stack、IPVS wrapper和Netlink Reflector。
WatchDog
WatchDog是计算机可靠领域中一个极为简单又很是有效的检测工具,它的工做原理是针对被监视的目标设置一个计数器和一个阀值,WatchDog会本身增长次计数值,而后等待被监视的目标周期性的重置该计数值。一旦被监控目标发生错误,就没法重置此计数值,WatchDog就会检测到,因而采起对应的恢复措施,例如重启或关闭。
在Linux中很早就引入了WatchDog功能,而Keepalived正是经过WatchDog的运行机制来监控Checkers和VRRP进程的。
Checkers
这是Keepalived最基础的功能,也是最主要的功能,可实现对服务器运行状态检测和故障隔离。
VRRP Stack
这是Keepalived后来引入的VRRP功能,能够实现HA集群失败切换(Failover)功能。Keepalived经过VRRP功能再结合LVS负载均衡软件便可部署一个高性能的负载均衡集群系统。
IPVS wrapper
这是IPVS功能的一个实现。IPVS wrapper模块能够将设置好的IPVS规则发送到内核空间并提交给IPVS模块,最终实现IPVS模块的负载均衡功能。
Netlink Reflector
用来实现高可用集群中Failover时虚拟IP(VIP)的设置和切换。Netlink Reflector的全部请求最后都发送到内核空间层的NETLINK模块来完成。
keepalived启动后会有三个进程
父进程:内存管理,子进程管理等等
子进程:VRRP子进程
子进程:healthchecker子进程
有图可知,两个子进程都被系统WatchDog看管,两个子进程各自复杂本身的事,healthchecker子进程复杂检查各自服务器的健康程度,例如HTTP,LVS等等,若是healthchecker子进程检查到MASTER上服务不可用了,就会通知本机上的兄弟VRRP子进程,让他删除通告,而且去掉虚拟IP,转换为BACKUP状态。