failover是指系统处理故障并恢复的过程,对于7*24小时的在线服务,为了保证高可用性(high availability),服务须要在出问题的时候可以自动恢复。如今多数分布式系统都实现了自动failover的功能。html
依赖服务fail的恢复机制能够很简单,while(true) + sleep循环直到依赖的服务可用为止,参见refer2的介绍。对于服务自己的HA,能够采用集群/热备份(Hot Spare)的方法。分布式
failover and switchover 的操做基本相同,差异是failover是自动恢复,switchover 是须要人介入的。spa
refer:htm
一、https://en.wikipedia.org/wiki/Failoverblog
二、failover机制的小讨论:http://www.cnblogs.com/Creator/p/3189758.htmlip