1服务器集群简介
注意:有关安装
群集服务器的信息,请参阅
Windows server 2003产品家族的帮助和部署指南。
关于Windows Server 2003的企业版和Datacenter版均可以支持最大达8个节点的集群配置;其典型的特征是可为数据库、消息系统、文件与打印服务这些关键业务应用,提供高可用性和可扩展性,在集群中的多个服务器(节点)保持不间断的联系。便是说若是在集群中的某一节点因出错或维护不可用时,另外一节点会马上提供服务,以实现容错。正在访问服务的用户能够继续访问,而不会察觉到服务已经由另外一台服务器(节点)提供。
[2]
2建立群集
在
服务器群集产品中含有用来在服务器上安装群集软件和建立新群集的群集安装实用工具。建立新群集时,首先在选择做为群集的第一个成员的计算机上运行该实用工具。第一步是肯定群集名称并建立群集数据库和初始的群集成员列表来定义新群集。 Windows server 2003 群集新增了一个群集管理设置向导以及使用 cluster.exe
命令行界面建立( 包括从远程建立 )群集的功能。
建立群集的最后一步是,在另外将要成为群集成员的每一台计算机上运行安装实用工具。每当将新节点添加到群集中时,新节点都会自动从群集的原始成员得到现有群集数据库的副本。当节点加入或造成群集时,群集服务会更新该节点私有的配置数据库副本。
3造成群集
若是服务器运行了群集服务而且没法找到群集中的其它节点,它本身能够造成一个群集。要造成群集,节点必须可以得到对
仲裁资源的独占权。
当最初造成群集时,群集中的第一个节点将包括群集配置数据库。每当有新节点加入群集时,新节点都会在本地得到并保持群集配置数据库的副本。
仲裁资源用恢复日志(其中含有同节点无关的群集配置和状态数据)的形式存储配置数据库的最新版本。
在群集运行中,群集服务使用仲裁恢复日志执行如下操做 :
保证只有一组活动、可相互通信的节点才能造成群集
仅当某个节点能够得到对
仲裁资源的控制权时 , 才容许它造成群集
4集群服务的状态
从群集中的其它节点和群集服务管理接口的角度看,当造成群集时,群集中的每一个节点可能处于三种不一样状态中的一种。事件处理器会记录这些状态,而事件日志管理器会将这些状态复制到群集的其它节点。群集服务状态包括:
脱机。此时的节点不是彻底有效的群集成员。该节点及其
群集服务器可能在运行,也可能未运行。
联机。此时的节点是彻底有效的群集成员。它听从群集数据库的更新、对仲裁算法施加本身的影响、维护心跳通信,并能够拥有和运行资源组。
暂停。它只能支持它当前已拥有的那些资源组。之因此提供暂停状态,是为了容许执行某些维护。大多数
服务器群集组件会将联机和暂停视为等价的状态。
5优点
2、
集群系统可解决
软件系统问题,咱们知道,在
计算机系统中,用户所使用的是
应用程序和数据,而应用系统运行在操做系统之上,操做系统又运行在服务器上。这样,只要应用系统、操做系统、服务器三者中的任何一个出现故障,系统实际上就中止了向
客户端提供服务,好比咱们常见的软件
死机,就是这种状况之一,尽管服务器
硬件无缺,但服务器仍旧不能向客户端提供服务。而集群的最大优点在于对故障服务器的监控是基于应用的,也就是说,只要服务器的应用中止运行,其它的相关服务器就会接管这个应用,而没必要理会应用中止运行的缘由是什么。
3、
集群系统能够解决人为失误形成的应用系统中止工做的状况,例如,当管理员对某台服务器操做不当致使该服务器停机,所以运行在这台服务器上的应用系统也就中止了运行。因为集群是对应用进行监控,所以其它的相关服务器就会接管这个应用。
6缺点
咱们知道集群中的应用只在一台服务器上运行,若是这个应用出现故障,其它的某台服务器会从新启动这个应用,接管位于共享磁盘柜上的数据区,进而使应用从新正常运转。咱们知道整个应用的接管过程大致须要三个步骤:侦测并确认故障、后备服务器从新启动该应用、接管共享的数据区。所以在切换的过程当中须要花费必定的时间,原则上根据应用的大小不一样切换的时间也会不一样,越大的应用切换的时间越长。
7加入群集
寻找
若是一个服务器要加入现有群集 , 则它必须运行群集服务而且必须成功找到群集中的其它节点。在找到其它节点后,加入的服务器必须接受群集成员资格验证,并得到群集配置数据库的副本。
条件
加入现有群集的过程开始于 Windows Server 2003 或 Windows 2000 Service Control Manager 在
节点上启动群集服务之时。在启动过程当中,群集服务会配置并装入该节点的本地数据设备。它并不会试图将共用的群集数据设备做为节点联机,由于现有群集可能正在使用这些设备。
过程
为了查找其它节点 , 会启动一个发现过程。当节点发现任何群集成员时,它将执行
身份验证序列。第一个群集成员会对新加入者进行
身份验证,而且在新服务器获得成功验证后返回成功状态。若是验证不成功(未能识别待加入节点的群集成员身份,或者它使用了无效的账户密码),则加入群集的请求会被拒绝。
验证
进行成功验证后,首先联机的群集节点会检查加入节点上的配置数据库副本。若是该副本已过期,对加入服务器进行验证的群集节点会为加入的服务器发送该数据库的更新副本。刚加入群集的节点在收到复制的数据库后,能够用它查找共享资源并根据须要将它们联机。
8脱离群集
当节点关闭或群集服务被中止时,节点可能脱离群集。但当节点不执行群集操做(好比不向群集配置数据库提交更新)时,节点也可能被迫脱离(被逐出)群集。
若是节点根据预先的计划脱离群集,它会向其它全部节点成员发送 ClusterExit 消息,通知它们它将脱离群集。该节点不等待任何响应就会当即进行关闭资源和全部群集链接的操做。因为其他
节点收到了退出消息,所以它们不会执行在节点意外失效或网络通信中止时发生的从新分组过程以从新确立群集成员身份。
9方法
有两种经常使用的服务器集群方法,一种是将备份服务器链接在主服务器上,当主服务器发生故障时,备份服务器才投入运行,把主服务器上全部任务接管过来。另外一种方法是将多台服务器链接,这些服务器一块儿分担一样的应用和数据库计算任务,改善关键大型应用的响应时间。同时,每台服务器还承担一些容错任务,一旦某台服务器出现故障时,系统能够在
系统软件的支持下,将这台服务器与系统隔离,并经过各服务器的负载转嫁机制完成新的负载分配。
PC服务器中较为常见的是两台服务器的集群,UNIX系统可支持8台服务器的
集群系统,
康柏的专用系统OpenVMS可支持多达96台服务器的集群系统。
10集群的特色
在
集群系统中,全部的计算机拥有一个共同的名称,集群内任一系统上运行的服务可被全部的网络客户所使用。集群必须能够协调管理各分离组件的错误和失败,并可透明的向集群中加入组件。用户的公共数据被放置到了共享的磁盘柜中,
应用程序被安装到了全部的服务器上,也就是说,在集群上运行的应用须要在全部的服务器上安装一遍。当
集群系统在正常运转时,应用只在一台服务器上运行,而且只有这台服务器才能操纵该应用在共享磁盘柜上的数据区,其它的
服务器监控这台服务器,只要这台服务器上的应用中止运行(不管是
硬件损坏、操做系统
死机、应用软件
故障,仍是人为误操做形成的应用中止运行),其它的服务器就会接管这台服务器所运行的应用,并将共享磁盘柜上的相应数据区接管过来。其接管过程以下图所示(以应用A为例):
1.应用A正常工做时;
2.应用A中止工做后,其它的备用服务器将该应用接管过来。 具体接管过程分三部执行: a.系统接管 b.加载应用 c.客户端链接
11集群技术的分类
-
高可用集群高可用集群的英文全称是High Availability,简称HA cluster。高可用的含义是最大限度地可使用。从集群的名字上能够看出,此类集群实现的功能是保障用户的应用程序持久、不间断地提供服务。
-
负载均衡集群负载均衡集群也是由两台或者两台以上的服务器组成。分为前端负载调度和后端服务两个部分。负载调度部分负载把客户端的请求按照不一样的策略分配给后端服务节点,然后端节点是真正提供养分程序服务的部分。与HA Cluster不一样的是,负载均衡集群中,全部的后端节点都处于活动动态,它们都对外提供服务,分摊系统的工做负载。
-
科学计算集群高性能计算集群,简称HPC集群。这类集群致力于提供单个计算机所不能提供的强大计算能力,包括数值计算和数据处理,而且倾向于追求综合性能。HPG与超级计算相似,可是又有不一样,计算速度是超级计算追求的第一目标。最快的速度、最大的存储、最庞大的体积、最昂贵的价格表明了超级计算的特色。随着人们对计算速度需求的提升,超级计算也应用到各个领域,对超级计算追求单一计算速度指标转变为追求高性能的综合指标,即高性能计算