前段时间应客户要求,写下VMware服务器虚拟化平台的应急方案,两节,第一节介绍整体平台的应急,第二节介绍如vCenter Server,SQL群集,主AD和备AD的应急方案。

   VMware服务器虚拟化平台由高性能服务器及高端存储设备组成,服务器通过SAN交换机卡连接共享存储设备,所有虚拟机数据文件全部保存在存储设备上,以保证数据的高可用性。服务器群集之间配置高可用性(HA),一旦某台物理服务器出现硬件故障,其上运行的所有虚拟机将自动迁移至其他物理服务器,网络中断时间不会超过10分钟,保证了业务系统的高可靠性。

   使用vSphere套件池化物理服务器,管理服务器有vCenter服务器、SQL虚拟服务器等,它们是应用云的重要架构组件,如图1所示。

p_w_picpath

图1 应用云逻辑架构图

平台保障方案

       通过关闭物理服务器进行应用云冗余测试,测试虚拟机是否自动迁移至其它服务器,测试方法如下:

1. 迁移演练时,选择数据中心下群集确认HA状态,如图1-1所示。

clip_p_w_picpath002

图2-1 确认HA功能

2. 查看虚拟机A在10.1.1.151上,如图1-2所示。

clip_p_w_picpath004

图2-2 虚拟机所在主机

3. 关闭10.1.1.151的主机电源,如图1-3所示。

clip_p_w_picpath006

图2-3 关闭主机

4. 警报选项查看HA生效,如图2-4所示。

clip_p_w_picpath008

图2-4 查看HA生效

5. 持续ping虚拟机A的IP地址10.1.1.160,虚拟机A在端口19个包后正常连通,如图2-5所示。

clip_p_w_picpath010

图2-5 ping包情况

6. 查看虚拟机A是否在主机10.1.1.150上启动,如图2-6所示。

clip_p_w_picpath012

图2-6 虚拟机启动状态

7. 虚拟机A完成自动迁移启动,正常工作。

 

vCenter服务器应急保障方案

       当vCenter服务器是应用云上的一台虚拟机,当承载它的物理主机损坏后,vCenter也响应应用云的应急方案,它会在群集的另一台物理主机启动并工作。

        由于vCenter只起到应用云管理作用,它停止工作后不影响应用云上高级功能,也不影响应用云上业务系统的正常运行。

       vCenter服务器停止工作后,且无法修复,则需要手工修复,修复时间1小时左右。

1. 迁移演练时,在群集内使用windows server 2008 datacenter的模板发布一台虚拟机,如图3-1所示。

clip_p_w_picpath014

图3-1 模板发布虚拟机

2. 在该虚拟机上,使用ODBC工具连接SQL数据库,如图3-2所示。

clip_p_w_picpath015

图3-2 ODBC连接

3. 安装vCenter的应用程序,如图3-3所示。

clip_p_w_picpath017

图3-3 安装vcenter

4. 安装完成后即可正常访问新的vCenter服务器,如图3-4所示。

clip_p_w_picpath018

图3-4 正常访问