年初时工班发现工做站和服务器都没办法用ntpq看时钟同步了,以下图所示。输入ntpq-p 就显示"The specified class was not found"服务器
经过排查,发现中央服务器和工做站均出现,本地工做站部分有,2台NMS则无缺,Linux机子也显示正常。因为系统对时钟要求很高,出现此状况后马上检查应用服务器状态,一样看不到。网络
一、但经过抓包和防火墙日志,能够看到与时钟服务器通讯的包,证实不是网络问题。线程
二、人为调错工做站时间(五、10分钟),观察在1小时后,可以同步正常时钟,证实时钟同步进程(ntpd)工做正常。3d
三、尝试复制正常配置文件、重装ntp软件都没法修复此问题。日志
四、回溯先前作的操做,NMS没有此问题,加上前一次也有ATS软件升级致使Ruby用不了的状况,便怀疑是ATS升级影响的,但承包商未没法重现,给出的解决方案是重装系统,这是不可接受的:一涉及数量多工做量太大,二未查明缘由后续仍可能再出现。blog
五、此故障在网上没有找到相同案例,可是了解到process monitor软件,为微软官方出品。可记录进程行为。利用软件记录ntpq出错时段。对比发如今到winrnr.dll后,有一条不一样,然后续不正常的机子的记录比正常机子少了很多,说明此为关键节点。进程
如上图,异常机在查找不到services文件后不久就退出线程了,所以找到正常机的文件拷ci
贝过去,立马就恢复了ntpq的功能,以下图:同步