系统集群

dataware for unix双机热备的详细配置(1)

第一章 简 介 1.1 Cluster技术 Cluster集群技术可以下定义:一组相互独立的服务器在网络中表现为单一的系统,并以单一系统的模式加以管理。此单一系统为客户工做站提供高可靠性的服务。 Cluster大多数模式下,集群中全部的计算机拥有一个共同的名称,集群内任一系统上运行的服务可被全部的网络客户所使用。Cluster必须能够协调管理各分离的组件的错误和失败,并可透明的向Cluster中加入组件。 一个Cluster包含多台(至少二台)拥有共享数据储存空间的服务器。任何一台服务器运行一个应用时,应用数据被存储在共享的数据空间内。每台服务器的操做系统和应用程序文件存储在其各自的本地储存空间上。 Cluster内各节点服务器经过一内部局域网相互通信。当一台节点服务器发生故障时,这台服务器上所运行的应用程序将在另外一节点服务器上被自动接管。当一个应用服务发生故障时,应用服务将被从新启动或被另外一台服务器接管。当以上任一故障发生时,客户将能很快链接到新的应用服务上。 Cluster集群可由N台服务器构成,当咱们取Cluster要求的最小值N=2时,就成为一个双机系统。 1.2 DataWare for UNIX系统 现代企业将许多工做从大机系统转向轻便、功能强大、用户友好的PC 服务器和工做站。多服务器组成Cluster执行关键性业务,这些服务器持续监视整个系统状态,保障了系统的高可靠性,为企业提供实时、持续、可靠的数据服务。 目前服务器硬件是普遍有效的,但缺乏链接的软件。用户须要一种适应性强、可靠性高、可灵活扩展的综合解决方案。使服务器转向集中维护的集群工做方式。 DataWare for UNIX 是一种用户可配置的软件级解决方案(与容错机系统比较)。DataWare 监控全部的软硬件的资源操做,而且能对多种错误状态作出自动处理。 DataWare 管理两个UNIX 服务器以两种不一样的模式(Hot Standby or Dual Active) 运行,当其中一台服务器当机或失效时,另外一台服务器接管对等服务器的应用系统,而用户依旧能够存取数据,并不须要知道哪一台服务器在提供服务。 DataWare支持Dual Active工做模式和Hot Standby工做模式。在Hot Standby模式中,一台服务器做为工做机运行业务软件,另外一台服务器做为备援服务器始终处于等候主服务器出故障并取而代之的状态;在Dual Active模式中, 两台服务器运行各自业务软件同时监测对方状态, 当其中一台发生故障时, 另外一台主机当即将故障服务器的工做接管过来。 1.3 特性 DataWare 是集成的全兼容于UNIX系统的容错软件,用户应用程序和硬件设备无须改动。DataWare能提供两种模式的容错服务,依照系统配置文件(“dw.cfg”)来创建。 当一台服务器当机或失效时, DataWare 自动切换应用到另外一台服务器上。这个切换过程能够手工去处理。用户能够执行升级置换或维护服务器的硬件和软件的工做。任意一台服务器的关键操做均可以设置成自动切回。DataWare 在原服务器(生产机)修复后,DataWare 又可切回全部应用给生产机。 1.4 DataWare 的硬件方面 双机系统的硬件包含如下几个部分: 1. 两台基于UNIX 系统的服务器或工做站。每台主机有它专有的操做系统、 应用软件和专有数据。 生产机:为客户端提供应用服务的主机 备份机:当生产机当机或失效时,可接管应用服务的主机 2. 专用网络 专用网络是为两台主机交换操做信息(如心跳信息)而指定的通道。 有两种类型的专用网络 *TCP/IP socket:网卡上绑定TCP/IP 协议,每台服务器没必要装有专用的网卡去链接专用网络。(可与公用网络共享同一网卡) *共享盘:在公共的RAID 系统上创建的5MB 空间。 必须至少创建一种专用网络。 建议:创建多种类型的专用网络防止单点故障。若是当其中一种传输介质或协议失效,这时经过冗余的通道工做。 3. 公用网络 公用网络是网络客户端存取主机资源的通道。 目前DataWare只支持TCP/IP协议。 工做网卡:每台生产机必须安装一块网卡来链接公用网络。这是双机系统接收请求和发送数据的网络接入点。 备份网卡:每台备份机必须安装一块网卡来链接公用网络。当生产机当机或失效时,备份机在接管服务的同时,此网卡将做为双机系统接收请求和发送数据的新的接入点。 4. 公用磁盘 公用磁盘用来存储用户的重要数据,在RAID 磁盘子系统上,每台服务器有它本身的文件系统分区。另外还有5MB 空间做为DataWare 运行时使用的”握手”通讯区。例如: /dev/rxxx (SCO UNIX 系统中的裸设备,xxx是裸设备名)。 须要具备双SCSI端口的RAID系统(Power 5XX0系列)。这种磁盘子系统支持在物理磁盘有故障的状况下,仍能在线存取数据。
相关文章
相关标签/搜索