对于复杂流程确认的运维自动化方案的理解与探讨

前言:后端

最近开始值班了,半夜三更处理一些个小问题,本身感受是小事,可是对于边缘节点业务线来讲多是天大的事。 在想,其实这些个东西,彻底能够作成自动化的东西。可是这个时候就出现了走流程和承担责任的问题了 ~ 你们懂的~ 安全


其实对于快速运维方案来讲,容易卡壳的地方,确定会有走流程,确认流程 ~ 其实有些时候,我们能够下放些权利,让普通管理员有少量控制权 ! 服务器

     我就拿下面的例子说说吧,基础部门和业务部门分别作啥的你们确定是有了解的 ~ 当业务运维工程师链接不上一台服务器的时候,会发邮件找人解决,其实发为啥发邮件,是由于他没有权限,他没有这个责任,他不是基础部门。其实这些个问题,每每是本身的程序导致cpu跑死了,或者是利用率跑满了,致使ssh链接不上,可让他们选择重启或者是在特殊的环境下本身链接到管理网处理的 ~session

      既然要这么作,那方方面面都要想到,尤为是权限的控制问题了~ 运维


首先须要使用kerberos用户登陆到平台上,后端会检测你是否已经有改组的权限。ssh

004137830.jpg

而后输入你要处理的服务器ip地址  (只有个别机房支持这套系统),系统会作ip的配对和字段的过滤。ide

003558398.jpg


下一步后,会根据系统里面你的手机号码进行验证码推送。spa


004413628.jpg


这时候就能够输入你的验证码了 ~设计


004311636.jpg

验证经过后,你就能够赶忙本身的状况操做服务器了,须要注意的是,状态只存在于20分钟,20分钟以后会清空服务器端的session对应。blog

这里的重启服务器,调用的是ipmitool接口,能够实现针对硬件的操做。

若是想执行管理网的console操做的话,须要你的领导审批一个认证,你获得一个验证码,也就是说 当你有手机验证码和审批下来的验证码才能够用这个功能。  咱们也不建议他们使用。

004847774.jpg



点击执行后,还会给技术部抄发一份你刚才执行的过程和结果。

035029709.jpg


像这样一个简单又高效的平台就产生了。这套系统安全方面我设计了两个点,一个是他的登陆的判断,还有就是手机验证码的判断。若是想用控制台这样的功能,就要走一个流程了,可是也不建议他使用,对于通常人来讲,这些已经够用了

总结下:

         咱们能够把这些个小来小去的东西,都作成一些个小系统,之后这些个功能多了,能够集中在一个平台上。 这些都是我们能提升效率,而不用为一些个鸡毛蒜皮的事情所打扰的好路子。

相关文章
相关标签/搜索