DBA日记:一次reboot致使的严重失误

 

              昨天下午,一现场要添加RAC节点,db1节点正常运行,添加db2节点;在db2上作了安装的一些配置后,须要reboot,数据库

因而直接就reboot;糟糕,这条命令错误地执行在db1上了,致使现场数据库直接停了。当时觉得一下子db1就能重启了,可是,服务器

等了30分钟,db1也ping不通;联系现场协助重启服务器,现场告知:服务器一直重启中,都没机会登陆系统。晕死!spa

后来尝试拔掉网线等操做,在某一次中,居然有短暂的10分钟能够登陆了,直接把crs的自启动 disabled,防止因为这个缘由致使操作系统

服务器一直重启。但一会后,仍是不断重启中。3d

 

曾经尝试按这篇文章(http://hi.baidu.com/xulianboo/item/943d5c114381524a3a176e9a)进行了排查,也不行。事件

 

       最后没有办法,协商的结果是,把db1从新安装系统,而后从新安装RAC,用rman备份恢复。现场打算在db1安装操做系统时,it

发现因为硬件有问题,仍是反复重启,安装都没办法进行。方案改成,先在db2上安装单机数据库,用备份作RAC到单机的恢复。登录

 

      为此,今天折腾了一天,虽然最终搞好了,但心太累!配置

      

     虽然这个问题最终没形成重大后果,但该问题对我从此DBA工做具备深入意义:要深入思考一下,之后如何防止相似事件。硬件

相关文章
相关标签/搜索