(一)系统环境描述浏览器
本文档基于RHEL6u5 系统安装,配置为2节点高可用集群,节点为两台VMware虚拟机。服务器
也可参考http://blog.51cto.com/ty1992/1325327工具
(二)RHEL6-HA集群安装前准备url
1、节点本地hosts解析配置3d
在各集群节点上配置本地hosts,添加节点信息。rest
2、配置本地yum安装源blog
在集群各节点上配置本地yum安装源。ip
3、关闭系统防火墙、SELinux及NetworkManager服务ci
在集群各节点上关闭系统防火墙服务,关闭NetworkManager服务,关闭SELinux。资源
(三)RHEL6-HA集群程序组件安装及启动
1、集群主程序组件安装
在集群各节点上执行yum命令安装高可用组件。
yum groupinstall “High Availability”
2、集群管理程序组件安装
在集群各节点上执行yum命令安装高可用管理工具组件。
3、启动集群管理程序服务
若为rhel5,则首先初始化,设置用户及密码
/usr/sbin/luci_admin init
Service luci restart
使用 admin/888888登录
在集群各节点上启动ricci服务。
修改集群各节点ricci用户密码。
在其中一个节点上启动luci服务。
命令显示能够经过此节点的url地址也网页方式访问集群管理工具。
(四)RHEL6-HA集群配置
1、登陆集群配置管理工具
使用浏览器访问上述启动luci服务的集群配置管理工具页面,使用root用户及密码登陆配置管理工具。
首次登陆,会弹出如下警告信息,点击OK完成登陆。
2、建立集群
点击左侧边栏“Manage Clusters”进入集群管理配置,再次点击“Create”建立集群。
填写节点与其余信息,并点击“Create Cluster”建立集群。
其中“Cluster Name”为集群名称;“Node Name”为集群节点名称,须要和节点hosts文件中保持一致,“Password”为节点ricci用户的密码,其余保持默认。
页面自动跳转并提示正在建立集群,建立完成后显示以下信息。
3、添加节点Fence设备
点击“Fence Devices”并点击“Add”添加设备。
在设备列表中选择“VMware Fencing (SOAP Interface)”。点击“Submit”提交。
其中“Name”为设备名称,IP地址为VMware虚拟化环境中的vCenter系统IP地址,“Login”为登陆vCenter的用户,“Password”为相应vCenter用户的密码。
建议在vCenter系统中单首创建一个做为集群Fence设备的用户,并使该用户对集群各节点的虚拟机具备开机、关机、重启等基本权限。
查找虚拟机UUID信息。
使用fence_vmware_soap命令来查找相应集群节点虚拟机的UUID信息。
命令显示该用户有权查看的全部虚拟机的UUID信息。
点击“Nodes”并点击template1-hb节点进入Fence设备关联配置。
点击“Add Fence Method”添加对应Fence设备。
其中“VM name”为虚拟机名称,“VM UUID”为虚拟机的UUID信息,勾选“Use SSL”,点击“Submit”提交。
点击“Nodes”并点击template2-hb节点进入Fence设备关联配置。按照上述步骤为第二个节点关联Fence设备。
4、建立故障切换域
点击“Failover Domains”进入故障切换域配置,点击“Add”建立。
配置信息后点击“Create”建立。
其中“Name”为故障切换域名称,两个节点的优先级设为1和10,数字越小表示优先级越高。
5、集群资源建立
点击“Resources”并点击“Add”增长资源。
在资源下拉列表中选择。依次按须要建立IP地址、文件系统、应用脚本三个集群资源。
IP地址资源:
文件系统资源:
脚本资源:
三个资源建立完成。
6、服务建立
点击“Service Groups”并点击“Add”增长服务。集群保护的服务由若干个集群资源组成,并属于一个故障切换域,该服务能够在此故障切换域中的节点上切换。
定义相关信息后点击“Add Resource”添加资源。
在服务中,包含三个资源:IP、Filesystem、Script;这三个资源具有必定的依赖关系,在集群配置中能够用Clild Resource的方式指定这种依赖关系,经常使用的依赖关系是:
IP -> Filesystem -> Script
服务启动的时候,会先启动IP,而后挂载文件系统,最后用脚本启动服务,反之亦然。
在资源列表中先选择IP地址资源;
而后点击“Add Child Resource”添加一个子资源,也就是文件系统资源;再点击“Add Child Resource” 添加最后一个资源,也就是脚本资源。资源添加完毕,点击“Submit”提交。
资源添加完毕,集群保护的“App”服务正常启动。集群配置完成。
(五)集群管理经常使用命令
1、查看集群状态
执行命令clustat能够查看当前集群状态。
Member Name显示集群节点名,此集群有两个节点。
Status表示集群节点的状态,Online表示集群节点是正常在线状态。
Service Name表示集群资源服务名,此处显示集群资源服务名称为App。
Owner表示集群资源服务运行在哪一个节点上,此处显示App运行在template1-hb节点上。
State表示集群资源服务运行状态,此处显示集群资源服务是已启动状态。
2、关闭集群中的资源组
clusvcadm -d App命令表示关闭集群资源服务App。意味着App服务所包含的浮动IP、文件系统、程序脚本都将中止。
3、启动集群中的资源组
clusvcadm -e App命令表示启动集群服务App。意味着App服务所包含的浮动IP、文件系统、程序脚本都将依次启动。
4、集群资源组切换
clusvcadm -r App命令表示手动将集群资源服务App从当前节点切换到另外一个节点上。
5、离线集群节点
若是要对集群中的某台服务器进行硬件维护或停机,能够先将集群服务在该服务器上中止,而后对该服务器关机或维护。若是资源正运行在该服务器上,那么资源将自动切换到另一台服务器上,若是该服务器没有运行资源,那么该操做对于集群中的资源没有影响。
执行service rgmanager stop 命令关闭资源组服务。
执行service cman stop 命令关闭集群服务。
命令执行完毕后,使用clustat命令显示集群状态,该节点应显示为“offline”。
6、上线集群节点
执行service cman start 命令启动集群服务。
执行service rgmanager start 命令启动资源组服务。
命令执行完毕后,使用clustat命令显示集群状态,该节点应显示为“online”。