RHCS集群服务 7.10

时间 2020-01-05

标签 rhcs 集群服务 7.10 栏目负载均衡繁體版

原文原文链接

集群linux

主要讲了HA（HighAvailability）网络高可用(在大多数状况下网络不会挂掉)。后端

配置：启动三个企业6的虚拟机、关闭火墙和selinux服务器

每台虚拟机上最好配置好解析，这样快(/etc/hosts)网络

eg:负载均衡

修改主机名分别为（/etc/sysconfig/network）:ide

Server1.example.com（管理机、控制端）性能

Server2.example.com（节点）测试

Server3.example.com（节点）url

配置三个虚拟机的yum源为(在/etc/yum.repos.d)spa

[Server]

name=localserver

baseurl=http://172.25.9.250/rh6.5

gpgcheck=0

[HighAvailability]

name=localserver

baseurl=http://172.25.9.250/rh6.5/HighAvailability

gpgcheck=0

[LoadBalancer]（负载均衡）

name=localserver

baseurl=http://172.25.9.250/rh6.5/LoadBalancer

gpgcheck=0

[ResilientStorage]

name=localserver

baseurl=http://172.25.9.250/rh6.5/ResilientStorage

gpgcheck=0

[ScalableFileSystem]

name=localserver

baseurl=http://172.25.9.250/rh6.5/ScalableFileSystem

"rhel-source.repo"25L, 464C

原来只有第一个，最后几个是要加的。

1.基本配置

在两台节点端（server2、server3）安装ricci（如下操做都是在两个节点上同时进行）

yum installricci –y

安装完以后通常会生成/etc/cluster这个目录，在这个目录中会有cluster.conf和cman-notify.d。若是没有的话，多是由于没有cman这个包，把它按上。yum install cman –y

chkconfig riccion 设置ricci开机启动

/etc/init.d/riccistart 开启ricci

echo westos |passwd –stdin ricci 给ricci密码（必定要有不然将认证失败）

在管理机|控制端（servser1）中安装luci

yum install luci-y

/etc/init.d/lucistart 开启luci

开启最后一行会出现一个地址，在wed端登陆着个地址

用root登陆

而后添加节点

注：若是出现问题提示你建立的集群存在，而你又想用该名字，那就进入/etc/cluster/中把cluster.conf删掉从新弄

出现以下错误：

能够看出是server中cman开启失败，因此在servser2中执行

/etc/init.d/cmanstart

弄好以后会出现下列状况

此时luci管理端正在为ricci的HA节点上自动安装所须要的包

完成后图形端：

在字符界面输入clustst会看到节点显示为online

2.fence（栅）设备的配置

Fence设备是RHCS集群中必不可少的一个组成部分，经过fence设备能够避免因出现不可预知的状况而形成“脑裂”现象，fence设备的出现，就是为了解决相似这些问题，fence设备主要就是经过服务器或存储自己的硬件管理接口，或者外部电源管理设备，来对服务或存储直接发出硬件管理指令，将服务器重启或关机，或者与网络断开链接。

Fence的工做原理是:当意外缘由致使主机异常或者宕机时，备机会首先调用fence设备，而后经过fence设备将异常主机重启或者从网络隔离，当fence操做成功执行后，返回信息给备机，备机在接到fence成功的信息后，开始接管主机的服务和资源。这样经过fence设备，将异常节点占据的资源进行了释放，保证了资源和服务始终运行在一个节点上。

在本次试验中使用物理主机做为fence设备。

选择fencedevices并命名

在物理主机（fencce设备）中安装下列软件

而后执行fence_virtd–c（fence_virtd）

直接空格

实验中写的是br0

高亮的文件要本身事先创建好，以后空格y就好

下面几步不是很懂，照着作就了。

往两个节点中也拷贝入fence_xvm.key拷到/etc/cluster下（server2和server3）

在物理主机（fence设备）中开启fence_virtd服务

而后查看fence端口开了没（1229）

而后添加fence设备（注意虚拟机的主机名与虚拟机名字要对应，最好使用id）

而后添加第二个fence设备

后面的和添加第一个同样

而后检验fence设计是否成功

停掉server2以后若是出现 fenceserver2.example.com success而且server2虚拟机重启的话，fence就设置成功。

3.添加错误域（失效转移）：两个服务同时支持一个挂后以后另外一个补上

Failover：又称故障切换，指系统中其中一项设备或服务失效而没法运做时，另外一项设备或服务便可自动接手原失效系统所执行的工做。

进入以后点Add增长

Priority:为优先级，越小优先级越高

Restricted:该服务只能在该节点中

No Failback:为服务不切回（默认为切回），就是指当坏掉的节点号了时，服务切不切回。通常只有当原来节点的性能大于备用节点的性能时，才切回。当两个节点的性能差很少时，通常不切回。

4.添加资源：

这个ip是一个虚拟的浮动ip，用于外界访问。当外界访问的是哪个节点时，该ip就在哪一个节点上。若是该节点坏掉以后，另外一个节点顶上的话，该ip就出如今顶替的节点上。（将会浮动出如今后端提供服务的HA节点上；最后一行的数字越小，浮动ip切换的速度越快。）

httpd服务必须是本身在HA节点上提早安装，但不要启动（在节点上不要开启httpd服务）。（这一步我不知道干吗）

5.添加服务组：

选择你刚刚添加的错误组的名字

而后点选择刚刚写的浮动ip与httpd

而后继续点，不要点

此次点浮动ip

而后能够看到

（网络资源）

可看见集群本身自动将192.268.122.34（浮动ip，按本次试验的话应该是在server1上启动了）上的httpd启动了。

注：后面的截图由于老师的机子出问题，因此从新安装了虚拟机。Sever11和server12为节点，server3为服务端。

在server11上配置测试页。

在server12上配置测试页。

在server12上clustat查看集群状态能够看到如今是server11在进行服务。

在server11上 ip addrshow 能够看出除了server11原来的ip以外server11上还有浮动ip。

6.测试

咱们可使server挂掉，而后看服务是否是转移到server上了

（1）把server的网断掉

再继续经过clustat查看集群服务状态，能够看到server12顶替了server11。同时浮动ip也会出如今server12上。能够用 ip addrshow查看。

（2）能够经过内核奔溃

266张