监控面板,预警设置,日志收集与统计分析,实时监控与故障恢复。运维
平台迁移与服务迁移、节点迁移。分布式
集群伸缩,滚动升级。工具
容错设计,容错测试。测试
平常备份与灾难备份。对于分布式系统,重建是很是复杂的,仅有数据备份是不够的。spa
灾备实施,灾难演习。设计
开发基础设施,流程,交付。日志