环境:HPUX 11.31;ServiceGurad A.11.20。2个node:node1,node2;一个package:pkg1.node
主机:BL860c i4app
故障现象:pkg1能够正常的在两个node之间切换,可是当其中一个node关机后,pkg1切到node2上只能运行1分钟左右,以后便会自动failed。ide
分析过程:ci
1.检查了pkg1的log,系统的syslog,均未发现异常。it
2.检查配置在pkg控制文件里的应用脚本,未发现异常。为了方便排查,暂时将定义在control文件里的应用脚本注释掉。class
3.注释掉以后,故障现场仍然存在。肩擦包配置文件,包控制文件,依然没有什么发现。集群
4.检查集群配置文件,和以往本身作的集群配置文件进行对比,发现客户的集群配置文件里多了SUBNET配置和IP_MONITOR配置。怀疑是监控
此缘由,故将其注释,以下:配置
#SUBNET 10.73.0.0方法
# IP_MONITOR OFF
# POLLING_TARGET 10.73.0.1
5.从新check,apply集群配置文件后,故障解决。
总结:通过查证,在集群配置文件里(通常为cluster.ascii)不须要写SUBNET参数(在pkg配置文件里写入MONITORED_SUBNET便可),也不须要IP_MONITOR参数,若是写了SUBNET,则必定要把IP_MONITOR 设置为OFF。
对于这种故障,解决方法为:A.注释掉集群配置文件里的SUBNET参数和IP_MONITOR参数。2.若是不注释,在必定要把IP_MONITOR配置为OFF。推荐方法A。IP监控的配置在包配置文件里能够定义,不用再在集群里定义。