高可用集群之heartbeat安装配置

1. 准备工做php

(本文永久地址:http://woymk.blog.51cto.com/10000269/1923285node

配置环境:centos6.9, nginx1.10, heartbeat-3.0.4mysql

先安装、配置两台服务器:linux

主机名: web1
eth0 ip: 192.168.75.131
eth1 ip: 10.1.1.11nginx

主机名: web2
eth0 ip: 192.168.1.132
eth1 ip: 10.1.1.12web


nginx yum安装请参考:sql

yum安装nginx最新官网稳定版windows

nginx 编译安装请参考:centos

LNMP环境搭建(centos6.9+mysql5.7+php7.1+nginx1.10)服务器


2. 分别在两台服务器上操做

为防止出现脑裂,关闭防火墙和selinux
iptables -F; 
setenforce 0
以上为临时关闭,请根据实际状况自行配置。


vi /etc/hosts
增长下面两行 
192.168.75.131 web1
192.168.75.132 web2


安装epel扩展源
rpm -ivh "http://mirrors.sohu.com/fedora-epel/epel-release-latest-6.noarch.rpm"

两台服务器都安装heartbeat,libnet
yum  install -y heartbeat* libnet


3. 在web1服务器上配置
cd /usr/share/doc/heartbeat-3.0.4/
cp  authkeys  ha.cf haresources /etc/ha.d/
cd /etc/ha.d


vi authkeys
修改或增长
auth 3
3 md5 Hello!

保存后修改文件权限

chmod 600 authkeys


vi haresources
加入
web1 192.168.75.130/24/eth0:0 nginx

这行配置的意思是:

web1 -- 表示主节点的主机名。

192.168.75.130 -- 设置虚拟ip,这里指定的IP地址就是集群对外服务的IP地址。

nginx -- 设置heartbeat托管的服务,这些服务能够由heartbeat来启动和关闭,服务脚本须要放到/etc/init.d/目录下。


vi ha.cf
改成以下内容:
debugfile /var/log/ha-debug    #调试信息
logfile /var/log/ha-log    #记录的日志
logfacility     local0    #系统日志级别
keepalive 2    #心跳间隔时间
deadtime 30    #超出该时间间隔未收到对方节点的心跳,则认为对方已经死亡
warntime 10    #超出该时间间隔未收到对方节点的心跳,则发出警告并记录到日志中
initdead 120    #在某些系统上,系统启动或重启以后须要通过一段时间网络才能正常工做,该选项用于解决这种状况产生的时间间隔。取值至少为deadtime的两倍,这个值设的越大启动越慢。
udpport 694    #使用udp端口694 进行心跳监测
ucast eth1 10.1.1.12    #采用单播,进行心跳监测,IP为对方主机IP
auto_failback on    #表示主节点恢复以后,自动切回
node    web1    #节点1
node    web2    #节点2
ping 192.168.75.1    #检查网络是否正常,通常设为网关或者路由路的ip
respawn hacluster /usr/lib64/heartbeat/ipfail    #该进程用于检测和处理网络故障,须要配合ping语句指定的ping node来检测网络链接。(若是安装的是32位操做系统请把目录改成/usr/lib/heartbeat/ipfail)


把三个配置文件拷贝到web2上
cd /etc/ha.d/
scp authkeys ha.cf haresources web2:/etc/ha.d/


4. 在web2上编辑ha.cf
vi  /etc/ha.d/ha.cf
只须要更改一个地方
找到
ucast eth1 10.1.1.12
改成
ucast eth1 10.1.1.11


5. 启动heartbeat
在web1和web2上分别执行
service heartbeat start

先web1,后web2

在windows客户端ping 192.168.75.130,能ping通就说明服务已经起来了

wKioL1kQbOWRkRbJAAAY6ouN2v4331.png-wh_50

在主节点web1上查看是否有 eth0:0

ifconfig

wKioL1kQajPhc5GwAAAuvWpF7wE243.png-wh_50


在主节点web1查看是否有nginx进程

ps aux |grep nginx

wKioL1kQaTuhnLAfAAAsZSnN8EI528.png-wh_50


6. HA功能测试

1) 在web1上模拟网络故障,把网卡eth0 down掉

ifdown eth0

在web2上查看日志

tail -f /var/log/ha-log

wKioL1kREHfRKDssAAB-pNp0o68791.png-wh_50

日志显示web2已经接管了web1的资源


在web2上查看是否有nginx进程启动

ps aux |grep nginx

wKioL1kRD5ijcZLzAAAxl_RjtoY954.png-wh_50

nginx服务已经启动


在web1上把eth0从新开启

ifup eth0

继续在web2上查看日志

wKiom1kRFduh-tHcAACoBR5RPB0221.png-wh_50

日志显示web2释放资源,自动切回到web1


2) 模拟服务器故障

把web1关掉,模拟服务器掉电

在web2上查看日志

tail -f /var/log/ha-log

wKiom1kREInBShZVAADMnr8XfCY432.png-wh_50

日志显示web1已经死掉,web2上的nginx服务已经启动


以上测试结果代表:当主节点挂掉后,备份节点成功接管了主节点的资源;当主节点故障恢复后,可以自动切回主节点,实现了高可用。

相关文章
相关标签/搜索