这节开始,我们将开始配置对Sharepoint的多维度的监控,

其中最基本的就是计算机是否在线的宕机监视。


Sharepoint监控①:宕机监视

警报阈值:


服务器

DB1

DB2

APP1

APP2

SCH1

WFE1

WFE2

DB3

DC

宕机

Y

Y

Y

Y

Y

Y

Y

Y

Y



1.所谓宕机监视,就是监视计算机有无脱机,是否能够正常通讯。

一般情况下,我们经常使用ping命令来确认设备是否在线。而SCOM使用检测信号监视代理与代理的主要管理服务器之间的通信通道。

检测信号是定期从代理向管理服务器发送的数据包,默认情况下每60秒发送一次并且使用端口5723 (UDP)。

如果代理有4次无法发送检测信号,则会生成“运行状况服务检测信号失败”警报,并且管理服务器会尝试使用 ping 与计算机联系。 如果计算机未响应 ping,则会生成“连接到计算机失败”警报。下图显示了此过程。

clip_p_w_picpath002

我们可以利用SCOM的这种检测信号来进行计算机的宕机监视。

在管理—>设置中,可以确认和修改检测信号的间隔和失败量。

clip_p_w_picpath004

信号间隔:

clip_p_w_picpath006

允许丢失信号数:

clip_p_w_picpath008

所以通过以上机制,SCOM可以在5分钟内确认计算机的宕机状态,发出警报,从而完成宕机监视。


2.现在事先创建针对Sharepoint监视的管理包。有了这种集成的管理包,我们可以方便地导出导入我们针对各种系统而做出的自定义设定。

打开管理—>管理包,点击创建管理包

clip_p_w_picpath010

输入管理包名称

clip_p_w_picpath012

点击创建

clip_p_w_picpath014


3.进入创作—>管理包对象—>监视器

找到运行状况服务观察程序的监视集。

在可用性下,对计算机不可访问和运行状况服务检测信号失败进行替代设置。

所谓替代,就是用自己自定义的值来替换SCOM中的默认值。

clip_p_w_picpath016

选择运行状况服务检测信号失败的监视器,替代所有对象。

clip_p_w_picpath018

勾选以下几项:

已启用:是指启用此监视器

生成警报:生成活动警报

自动解决:当故障恢复时自动解除警报

管理包选择自定义的Sharepoint System

clip_p_w_picpath020

对计算机不可访问监视器,也做出同样替代

clip_p_w_picpath022


4.修改完成后,我们尝试使WFE1脱机,关机或断开网络都可以。

稍等5分钟左右,就会在活动警报中,出现以下两个警报:

clip_p_w_picpath024

点开进入产品知识,可以查看具体内容

clip_p_w_picpath026

clip_p_w_picpath028


5.当我们使WFE1这台服务器重新在线时,活动警报会自动关闭,消失。

那我们怎么确认历史警报呢?

我们可以新建自定义警报视图

clip_p_w_picpath030

名称取所有警报,条件为查看所有警报

clip_p_w_picpath032

进入所有警报视图,可以查看确认警报已经关闭。

clip_p_w_picpath034