服务器运行维护流程

 1.平常服务器运维部自我巡检:
(1)每日早8:00经过cacti监控软件查看全部服务器总流量、单兵流量、CPU和内存使用状况、硬盘使用状况等运行是否正常。
 (2)对异常单兵服务器进行查看CPU、内存占用率等进行详细分析和排查。
(3)对异常单兵进行全部服务进程检查,看是否正常,并进行排查。
(4)查看使用用户,是否有异经常使用户登陆。若有异经常使用户登陆,查看该用户下的文件,是否有木马、病毒或有威胁的文件,进行删除和维护。
(5)查看服务器系统是否须要打新的补丁,如需升级,进行升级。
(6)在服务器和本机上同时对网页的打开速度进行测试,登录到系统上查看系统页面中程序运行是否正常。 是否正常。
(7)对公司五大系统接口进行打开测试查看是否正常。
测试内容:
集采平台打开测试;
便利店系统打开测试;
云仓储接口打开测试;
云管理接口打开测试;
云支付买买金接口打开测试。
2.周和月服务器运维部自我巡检:
经过查看监控周流量和月流量、服务器各项硬件使用状况查看等分析
(1)在管理工具中查看事件查看器中的应用、安全、系统、日志中的工做状态,是否有异常状况,若有进行清除和修复,每星期进行一次清除工做。
(2)每两个星期检查一次操做系统日志。
 (3)每星期定时对服务器的网站程序文件进行备份。备份原则上采用数据库彻底备份加日志备份策略、web前端增量备份;
一、备份数据存储策略:本机、异机、2个级别。
二、重要更新时间点先后必须作数据库备份或日志备份,特别是在作数据库表更新、应用程序更新。 
三、天天检查全部数据库备份操做是否正确完成、异地传输是否正常完成,并填写检查表。
四、在异地备份数据准确存储后,能够将超过2周 以上的异机备份数据经过自动删除脚本进行删除,以便腾出存储空间。 
(4)为保证服务器系统正常运行,每星期对系统盘C盘进行垃圾清理和维护。
(5)在数据库服务器、关键应用服务器上,只能有数据库DBA人员的账号,开发人员须要介入时,填写开发人员使用数据库申请单向上级申请。
 3.运维部自我巡检周和月工做总结:
对一个月内服务器系统的运行状况进行汇总,把解决的问题及不能解决的问题概括总结并向上级领导提交,经过会议形式决定解决办法和执行方式来解决所面临的问题。
4.机房协助巡检:
机房每周会对机柜使用状况、流量峰值状况、机柜温度、湿度等进行巡检,每周发送到公司运维部,进行评估和查看
 五、服务器硬件按期更换和清理: 针对全部服务器硬件清洁期限和更换以下: 一、每一年进行服务器灰尘开盖清理,经过机房人员协助; 二、对于存储硬盘,期限为两年更换一次,保证硬盘的正常使用; 三、电源模块测试,如有欠压和损坏的进行完全更换。
相关文章
相关标签/搜索