VMware vSphere 5.5 高可用性

VMware vSphere 5.5 高可用性

     主要讲的是集群的一些功能和配置,相比5.0的设置,没有太大的变化。VMware vSphere为虚拟机提供虚拟化的基础架构,将现有的物理资源转化成虚拟资源,将物理资源分红若干资源,为每一个虚拟机提供包括CPU、内存等虚拟资源。要想很好地分配这些资源,就必需要使用资源池。资源池是灵活管理资源的逻辑抽象。资源池能够分组为层次结构,用于对可用的 CPU 和内存资源按层次结构进行分区。群集中的资源池比单个ESXi主机上的还要重要,由于在群集中建立资源以后,整个资源池管理的就是全部的ESXi主机资源了。所管理的资源是全部ESXi主机上的CPU和内存的资源总和。

        高可用性和双机热备是VMware vSphere 5.5最重要的一部分,高可用并非vSphere独有的,企业使用高可用就是为了服务的连续性和数据的安全性,HA是以一群ESXi服务器为主的群集功能,主要是目的是当虚拟机运行的主机发生故障时能及时转移主机,避免长时间的停机。而FT双机热备则是保证虚拟机最长时间不停机,将虚拟机以双机热备的方式同时在两台主机运行,大大加强了业务的可连续性。

    主要讲的如下内容:

1、 创建群集

2、 设置HA高可用性

3、 测试HA高可用性

4、 设置DRS

5、 创建FT双机热备

        不管是计划停机时间仍是非计划停机时间,都会带来至关大的成本。可是,用于确保更高级别可用性的传统解决方案都须要较大开销,而且难以实施和管理。VMware 软件可为重要应用程序提供更高级别的可用性,而且操做更简单,成本更低。使用 vSphere,组织能够轻松提升为全部应用程序提供的基准级别,而且以更低成本和更简单的操做来实现更高级别的可用性。使用vSphere,能够独立于硬件、操做系统和应用程序提供更高可用性,减小常见维护操做的计划停机时间,在出现故障时提供自动恢复。vSphere 能够减小计划的停机时间,防止出现非计划停机,并迅速从断电中恢复。

创建群集

        多台电脑组成的集合就称为集群,集群的目的就是将计算机的负担分配到多台主机上,或是当运行某一个服务的物理服务器弹出问题时,让另外一台服务器接手这些服务。在VMware vSphere中,将多台ESX物理服务器组成一个集群,在这个集群中某台服务器出现故障时,这台服务器上运行的虚拟机可用自动迁移到其余可用的ESX服务器上,从而保障业务的不间断运行。

        集群就是把全部的ESX/ESXi组织起来,造成一个大的资源池,全部的虚拟机可在池中的任意主机上自由移动,而且Cluster可作到快速扩容和HA故障冗余;因此Cluster是服务器虚拟化通往数据中心的必备功能。

        vSphere集群包括DRS集群、HA集群和DPM集群。

1DRS:分布式资源调度,用于动态调整ClusterESX主机负载,自动把负载较重的主机上的虚拟机经过VMotion迁移到负载较轻的主机上,最终达到整个Cluster中的主机资源消耗平衡。

2HA:高可用性,用于意外故障切换,当监控到Cluster中有主机意外故障时,会自动在其余主机上启动故障主机上以前承载的虚拟机。

3DPM:分布式电源管理,用于在负载较轻时,把虚拟机动态“集中”到Cluster中的少部分主机上,而后把其余ESX/ESXi主机待机,以节省电力消耗,等负载较大时,再从新唤醒以前待机的主机。

        当了解群集后,下面就来创建群集

1、在vSphere Client 中,右击数据中心或文件夹,而后在弹出的快捷菜单中选择“新建群集”

1.jpg

2、在名称文本框中为群集命名。该名称显示在vSphere Client 清单面板中。

2.jpg

3、若是适用,启用加强型vMotion兼容性 (EVC),并选择它应以何种模式运行。在这里能够看到EVC所支持的AMDInterCPU类型。不过要注意的是,即使使用EVC,也不能将Intel服务器上的虚机迁移到AMD主机上。因此EVC只有三个选项:禁用、Intel或者AMD

3.jpg

4、选择虚拟机的交换文件位置。能够将交换文件与虚拟机自己存储在同一目录中,或者将交换文件存储在主机指定的数据存储中(主机-本地交换)。单击“下一步”

4.jpg

5、单击“完成”按钮以完成群集的建立,新群集不包括任何主机或虚拟机。

5.jpg

6、完成创建群集后,该名称显示在vSphere Client 清单面板中。

6.jpg

7、添加ESXi主机,能够从清单或列表视图中选择主机或者将主机拖至目标群集对象。

7.jpg

8、将全部的主机都拖至目标群集对象。

8.jpg

2、 设置HA高可用性

        vSphere HA 利用配置为群集的多台 ESXi 主机,为虚拟机中运行的应用程序提供快速中断恢复和具备成本效益的高可用性。vSphere HA经过在群集内的其余主机上从新启动虚拟机,防止服务器故障。持续监控虚拟机并在检测到故障时对其进行从新设置,防止应用程序故障。与其余群集解决方案不一样,vSphere HA 提供基础架构并使用该基础架构保护全部工做负载。无需在应用程序或虚拟机内安装特殊软件。全部工做负载均受 vSphere HA 保护。配置 vSphere HA 以后,不须要执行操做便可保护新虚拟机。它们会自动受到保护。

        vSphere HA 能够将虚拟机及其所驻留的主机集中在群集内,从而为虚拟机提供高可用性。群集中的主机均会受到监控,若是发生故障,故障主机上的虚拟机将在备用主机上从新启动。建立 vSphere HA 群集时,会自动选择一台主机做为首选主机。首选主机可与 vCenter Server 进行通讯,并监控全部受保护的虚拟机以及从属主机的状态。可能会发生不一样类型的主机故障,首选主机必须检测并相应地处理故障。首选主机必须能够区分故障主机与处于网络分区中或已与网络隔离的主机。首选主机使用网络和数据存储检测信号来肯定故障的类型。

        在设置HA以前,要确保每台ESXi主机都有管理网络冗余,而且vSphere HA检测信号数据存储数目为1,少数要求数目为2。若是不知足其要求,则会在配置HA的过程当中提示配置问题,以下图:

9.jpg

        要确保管理网络冗余,也可使用多个管理网络,管理网络冗余以下图:

10.jpg

        确认全部虚拟机及其配置文件都驻留在共享存储器上。确认主机配置为具备该共享存储器的访问权限,以即可以使用群集中的不一样主机打开虚拟机电源。当设置好管理网络和存储后,下面咱们就开创建HA群集配置。

1、右键单击群集,而后单击编辑设置。

11.jpg

2、在群集的“设置”对话框中,您能够修改群集的 vSphere HA(和其余)设置。在“群集功能”页上,选择打开 vSphere HA

12.jpg

3、根据须要为群集配置 vSphere HA 设置主机监控状态、接入控制、虚拟机选项、虚拟机监控和数据存储检测信号等功能。

13.jpg

4、默认虚拟机设置控制虚拟机的从新启动顺序(虚拟机从新启动优先级)以及在主机之间失去网络链接时 vSphere HA 的响应方式(主机隔离响应)。这些设置适用于主机发生故障或主机隔离时群集内的全部虚拟机。此外,也能够为特定虚拟机配置异常。

14.jpg

5、若是在设置的时间内没有收到单个虚拟机的 VMware Tools 检测信号,虚拟机监控将从新启动该虚拟机。一样,若是没有收到虚拟机正在运行的应用程序的检测信号,应用程序监控也能够从新启动该虚拟机。能够启用虚拟机监控功能,并配置 vSphere HA 监控无响应时的敏感度。

15.jpg

        在默认群集设置里能够配置监控敏感度的级别。高敏感度监控能够更快得出已发生故障的结论。然而,若是受监控的虚拟机或应用程序实际上仍在运行,但因为资源限制等因素致使未收到检测信号,高敏感度监控可能会错误地认为此虚拟机发生了故障。低敏感度监控会延长实际故障和虚拟机重置之间服务中断的时间。检测到故障后,vSphere HA 会重置虚拟机。重置可确保这些服务仍然可用。为了不因非瞬态错误而反复重置虚拟机,默认状况下,在某个可配置的时间间隔内将对虚拟机仅重置三次。在对虚拟机执行过三次重置后,指定的时间结束以前,vSphere HA 不会在后续故障出现后进一步尝试重置虚拟机。可使用每一个虚拟机的最大重置次数自定义设置来配置重置次数。

        监控灵敏度高时,故障时间间隔30(秒),重置期为1 小时。监控灵敏度中时,故障时间间隔60(秒),重置期为24小时。监控灵敏度低时,故障时间间隔120(秒),重置期为7天,在默认群集设置中,左右调整按钮来控制监控灵敏度

6、当 vSphere HA 群集中的首选主机没法经过管理网络与从属主机通讯时,首选主机将使用数据存储检测信号来肯定从属主机是否出现故障,是否位于网络分区中,或者是否与网络隔离。vCenter Server 为每一个主机选择的检测信号数据存储的数量。

16.jpg

7、正在配置每台ESXiHA功能。

17.jpg

8 配置完成后,ESXi主机会在群集中。

18.jpg

3、测试HA高可用性

        当设置 vSphere HA 群集以后,群集内的全部虚拟机无需额外配置便可得到故障切换支持。减小了硬件成本和设置虚拟机可充当应用程序的移动容器,可在主机之间移动。管理员会避免在多台计算机上进行重复配置。使用 vSphere HA 时,必须拥有足够的资源来对要经过 vSphere HA 保护的主机数进行故障切换。可是,vCenter Server 系统会自动管理资源并配置群集。提升了应用程序的可用性虚拟机内运行的任何应用程序的可用性变得更高。虚拟机能够从硬件故障中恢复,提升了在引导周期内启动的全部应用程序的可用性,并且没有额外的计算需求,即便该应用程序自己不是群集应用程序也同样。经过监控和响应 VMware

        Tools 检测信号并从新启动未响应的虚拟机,可防止客户机操做系统崩溃。

1、首先咱们看到,新建虚拟机1和新建虚拟机2都运行在ESXi02上,如今咱们就模仿事故的发生,将ESXI02进行强行关闭。

19.jpg

2、当咱们的vSphere HA 检测到esxi02出现故障时候,HA功能自动激活,全部在esxi02上的虚拟机会在esxi01上启动。

20.jpg

3、当虚拟机成功切换到esxi上时,此时候,HA失效,由于群集中只有1ESXi主机是正常运行的,因此在从此的正式环境中,要配置HA功能,群集中的主机不得少于3台。这样能确保虚拟机的安全运行。

21.jpg

4、 设置DRS

        DRS 群集是一组具备共享资源和共享管理接口的ESXi主机及关联虚拟机。必须建立 DRS 群集,才能从群集级别资源管理中获益。DRS是跨聚合到逻辑资源池中的硬件资源集合来动态地分配和平衡计算容量的。VMware DRS 是跨资源池不间断地监控利用率,并根据反映业务须要和不断变化的优先级的预约义规则,在多台虚拟机之间智能地分配可用资源的。当虚拟机负载增大时,VMWare DRS 会经过在资源池中的物理服务器之间从新分发虚拟机来自动分配额外的资源。

        DRS可使资源优先用于最重要的应用程序,以便让资源与业务目标协调,自动、不间断地优化硬件利用率,以响应不断变化的状况,而且为业务部门提供专用的(虚拟)基础结构,同时让IT 部门可以集中。全面地控制硬件,能执行零停机服务器维护等。在自动模式下,DRS 将肯定在不一样的物理服务器之间分发虚拟机的最佳方式,并自动将虚拟机迁移到最合适的物理服务器上。在手动模式下,Vmware DRS 将提供一个把虚拟机放到最佳位置的建议,并将该建议提供给系统管理员,由其决定是否进行更改。

        VMware DRS容许用户自已定义规则和方案来决定虚拟机共享资源的方式以及它们之间优先权的判断根据。当一台虚拟机的工做负载增长时,VMware DRS会根据先前定义好的分配规则对虚拟机的优先权进行评估。若是该虚拟机经过了评估,那么DRS就为它分配额外的资源,当主机资源不足的时候,DRS就会寻找集群中有多余可用资源的主机,并将这个虚机vMotion到上面,以调用更多的资源进行其重负载业务。

        DRS分配资源的方式有两种:将虚拟机迁移到另一台具备更多合适资源的服务器上,或者将该服务器上其余的虚拟机迁移出去,从而为该虚拟机腾出更多的“空间”。

        其实VMware DRS主要是负载平衡群集中的ESXi服务器。VMware DRS将持续监控群集内全部主机,监控虚拟机的 CPU、内存资源的分布状况和使用状况。在给出群集内资源池和虚拟机的属性、当前需求以及不平衡目标的状况下,DRS 会将这些衡量指标与理想状态下的资源利用率进行比较。而后,它会相应地执行虚拟机迁移。

        其次是电源管理vSphere Distributed Power Management (DPM) 功能启用后,DRS 会将群集级别和主机级别容量与群集的虚拟机需求(包括近期历史需求)进行比较。若是找到足够的额外容量,DPM会将主机置于(或建议置于)待机电源模式;或者若是须要容量,则建议打开主机电源,根据提出的主机电源情况建议,可能须要将虚拟机迁移到另一台具备更多合适资源的服务器上,或者将该服务器上其余的虚拟机迁移出去。

1、在VMware Client中选择群集,右键选择编辑设置,打开cluster设置窗口,单击打开vSphere DRS 框来启用 DRS 功能。这样,DRS就打开了,以后咱们要使用DRS来管理群集资源。

22.jpg

2、择 DRS 的默认的自动化级别,当这个群集的DRS自动化参数配置成手动,且每一次群集中的ESXi主机上的虚拟机激活时,系统就会提示你要在哪一台可用的ESXi上激活这台虚拟机,在激活时,系统会给出可用的主机,而且以优先顺序推荐的等级来排序。最适合的ESXi主机会在最前面。选择半自动DRS时,系统会自动选择虚拟机最佳时机,不会让用户来选择主机,可是在真正进行转移动做以前,仍是会要求用户键入回车。选择全自动的DRS时,会在虚拟机激活时自身找到最佳的ESXi主机而且根据配置值激活vMotion来转移主机。全自动的DRS配置有5个:保守、相对保守、中等、相对激进、激进。

23.jpg

3、经过使用此主机 DRS 组,能够建立虚拟机与主机间的关联性规则,从而与适当的虚拟机 DRS 组创建关联性(或反关联性)关系。在“主机 DRS 组”部分中,单击添加。

24.jpg

4、以使用规则。控制群集内主机上的虚拟机的放置位置。能够建立两种类型的规则。一种是用于指定虚拟机组和主机组之间的关联性或反关联性。关联性规则规定,所选虚拟机 DRS 组的成员能够或必须在特定的主机 DRS 组成员上运行。反关联性规则规定,所选虚拟机 DRS 组的成员不能在特定的主机DRS 组成员上运行。另外一种是用于指定各个虚拟机之间的关联性或反关联性。指定关联性的规则会使 DRS 尝试将指定的虚拟机一块儿保留在同一台主机上(例如,出于性能考虑)。

25.jpg

5、在虚拟机选项里,能够正对某些虚拟机作自动化级别的个性设置。

26.jpg

6、经过vSphere Distributed Power Management (DPM) 功能,DRS 群集能够根据群集资源利用率来打开和关闭主机电源,从而减小其功耗。vSphere DPM 监控内存和 CPU 资源的群集中全部虚拟机的累积需求,并将其与群集中全部主机的总可用资源量进行比较。若是找到足够的额外容量,则vSphere DPM 会将一台或多台主机置于待机模式,并将其虚拟机迁移到其余主机,而后关闭其电源。相反,当认为容量不够时,DRS 会使这些主机退出待机模式(将它们打开电源),并使用vMotion将虚拟机迁移到这些主机上。当进行这些计算时,vSphere DPM 不只考虑当前需求,并且还会考虑用户指定的全部虚拟机资源预留。

27.jpg

7、也能够单独为群集中的单个主机设置电源管理选项

28.jpg


8、此时能够再群集的摘要中能够看到vSphere DRS的详细状况。

29.jpg

5、 创建FT双机热备

        vSphere HA 经过在主机出现故障时从新启动虚拟机来为虚拟机提供基本级别的保护。vSphere Fault Tolerance可提供更高级别的可用性,容许用户对任何虚拟机进行保护以防止主机发生故障时丢失数据、事务或链接。Fault Tolerance 经过确保主虚拟机和辅助虚拟机的状态在虚拟机的指令执行的任什么时候间点均相同来提供连续可用性。使用 ESXi 主机平台上的 VMware vLockstep 技术来完成此过程。vLockstep 经过使主虚拟机和辅助虚拟机执行相同顺序的 x86 指令来完成此过程。主虚拟机捕获全部输入和事件(从处理器到虚拟 I/O 设备),并在辅助虚拟机上进行重放。辅助虚拟机执行与主虚拟机相同的指令序列,而仅单个虚拟机映像(主虚拟机)执行工做负载。若是运行主虚拟机的主机或运行辅助虚拟机的主机发生故障,则会发生即时且透明的故障切换。正常运行的ESXi 主机将无缝变成主虚拟机的主机,而不会断开网络链接或中断正在处理的事务。使用透明故障切换,不会有数据损失,而且能够维护网络链接。 在进行透明故障切换以后,将从新生成新的辅助虚拟机,并将从新创建冗余。整个过程是透明且全自动的,而且即便 vCenter Server 不可用,也会发生。

        其实在平常的虚拟化使用中,不多用到FT功能,一是对资源浪费比较严重,二是单个虚拟CPU没法知足业务的需求,三是只有不多有一些应用要求低配置,却要求高可用的要求。

1、在创建FT双机热备以前,要确保虚拟机的虚拟CPU11核心。

30.jpg

2、其次是要创建FT功能的主机必须有VMlernel网络用于FT

31.jpg

3、在群集设置中,知足FT的群集要求,建立并启用vSphere HA 群集,在群集设置中勾选“打开vSphere HA

32.jpg

4、检查ESXi主机的CPU是否支持FT指令,若是不支持,会在打开FT时报错,如图8-17所示。

33.jpg

5、右击一个虚拟机并在弹出的快捷菜单中选择 Fault Tolerance > 打开 Fault Tolerance

34.jpg

6、开启FT须要使用精简置备的磁盘,因此在开启FT前,vCenter会自动转换虚拟机磁盘。

35.jpg

7、转换以后,特定的虚拟机将指定为主虚拟机,并在另外一台主机上次要辅助虚拟机。如今,主虚拟机已启用了容错功能。虚拟机运行在esxi01上,FT保护副本运行在esxi02

36.jpg