1,根据现有结构部署工具(PXE+kickstart)
2,结合应用系统需求定制部署模版
3,制做系统优化等一键执行脚本
4,自动化部署实施
5,根据定制的优化内容对自动化部署效果进行检验php
1,在新批量部署的服务器上部署LNMP环境;
2,对批量化部署的环境进行效果检验;
3,编制Nginx配置文件并批量化部署;
4,根据需求作Nginx服务相关的优化(expires/gizp等)前端
需求:解决网站web服务器单点故障的问题mysql
职责:
1,研究多种负载均衡方案
主要针对lvs+keepalived及nginx+keepalived进行研究
2,编写新架构方案实施项目书与实施日程
3,新系统部署与平常维护
把公司原来的多数单点服务器变成了集群,提高了网站的稳定性与高并发的应用场景nginx
需求:解决公司root权限泛滥问题web
职责:redis
1,提出权限整改解决方案,改进公司root权限泛滥的现状
2,召集你们开会商讨并肯定方案后推动实施
3,实施后使得公司的权限管理更加清晰了(总结维护),从根本上下降了内部操做等不规范及安全隐患的发生。sql
问题1:大家公司是如何来管理用户权限的?
答:咱们是经过sudo来管理权限的,不管是运维仍是开发,通常都不会给root权限,只有核心级开发或者研发总监或以上级别的咱们才可能给相应服务器级别的权限;对核心运维或者运维总监才会给root权限shell
问题2:在规划服务器的时候,在服务器上都跑几个普通用户?
答:咱们的普通用户是根据项目来的,在不一样公司它的项目产品线不同。咱们公司只有十几个产品线,咱们为每个项目创建一个普通用户,所以不论nginx仍是tomcat都是跑在普通用户下。数据库
问题3:那一些公用服务呢?好比memcached或者redis。
答:这些公共服务也能够跑在普通用户下,总的来讲是这样的,我对运维的理解是,运维作运维的事情,开发作开发的事情。运维负责网络系统,只要系统没有故障,只要网络没有故障,只要系统资源还够用,那么咱们运维的职责就到位了。而咱们公司的理念是项目负责制,也就是说每一个项目的责任人是开发,咱们运维大概占30%-40%的责任。咱们的开发占60%的责任。当进程上线的时候,这个服务是由普通用户跑的。它的每一个站点目录都是普通用户的权限,也就是700的权限普通用户,这个是最安全的。不管是项目的启动,中止,以及代码上线,日志收集,日志分析都是经过咱们进程跑的普通用户实现的。咱们在管理这个项目的时候,咱们能够把开发的用户加到这个项目组里面,这样负责相应项目的开发人员就有对应项目的全部权限。后端
1,权限控制后进一步实施对全部用户日志记录方案
2,经过sudo和rsyslog配合实现对全部用户进行日志审计并将记录集中管理
3,实施后让全部运维和开发的全部执行的命令都有记录可查,杜绝了内部人员的操做安全隐患
需求:公司服务器逐渐增多,所以管理起来很麻烦,因而提出解决批量分发管理解决方案,进行全网服务器数据分发与管理
职责:
1,针对ansible分发工具及ssh key+rsync两套分发管理方案研究,最终选择简单易于维护而且强大的ssh key+rsync方案
2,找一台IDC内网服务器,做为分发机器,对固定普通用户作sshkey认证(注意不是root),须要root权限,经过sudo来控制,减小安全隐患。
3,对于分发机进行安全配置,例如,去掉外部IP,开启防火墙。实施完毕,运维管理的效率提升了不少,所以获得了公司的嘉奖。
需求:为公司数据作一个完整的备份系统
职责:
1,针对公司重要数据备份混乱状态和领导提出备份全网数据解决方案
2,经过本地打包备份,而后rsync结合inotify应用把全网数据统一备份到一个固定存储服务器,而后在存储服务器上经过脚本检查并报警管理员备份结果
3,按期将IDC机房的数据备份公司的内部服务器,防止地震火灾等问题致使的数据丢失。
1,在进入公司以前前任运维丢失数据,所以老大很重视数据安全这方面
2,我提出并上线了MySQL数据库备份方案和MySQL架构方案
3,方案主要是在从库上开启binlog及按天分库分表全备,推送到备份服务器
4,将备份的数据按期恢复到测试库给开发使用
5,制定人工更新数据库的流程及制度
1,公司使用LNMP架构,优化较少,运行效果不佳
2,我提出了LNMP架构的优化方案
3,方案主要是Linux系统优化,nginx服务优化,php服务优化,MySQL优化
4,优化完成后,LNMP架构性能有很大提升。
需求:到公司后,没有任何监控系统,每次故障没法报警,每次故障对公司的网站都形成了很大的影响,所以我用本身已经掌握的监控技术,以及查询资料撰写解决方案,提交给公司领导,以改善服务器报警不及时的问题,最大限度的保证公司网站故障及时处理
职责:
1,根据需求选定最流行的监控软件zabbix进行研究。
2,根据不一样服务器具体需求定制模版进行监控实时报警
实施完毕后,作到了大部分的故障报警都能及时有效的汇报给管理员,为网站的稳定争取了时间
起止时间: 2016/03-2016/04
软件环境: CentOS6.5
开发工具: jumpserver
项目描述:在投入工做的几个月里,我发现公司的服务器运维管理中对于服务器帐号的管理十分混乱,有的运维甚至有好几个工做帐号,并且能随时登录root帐户。所以,每当有运维工做人员调岗或离职,服务器的全部帐户密码都会被从新改变一次,不只费时费力,密码也很差记忆,十分的麻烦。因而,几经思考,我向领导建议启用开源型的跳板机jumpserver来改善目前混乱的情况。
项目职责:
如期中架构图
如期中架构图
需求:减轻访问高峰阶段存储压力
职责:
1,Web前端存储使用NFS主备结构
2,用户写入数据,如图片,附件等,存储到NFS主上面,用户的读访问NFS备
3,NFS主备,使用rsync+inotify进行数据同步
4,NFS存储数据量不大,采用sersync把数据推送到web前端,尽可能较少前端服务访问后端服务器的请求,减轻NFS存储压力
5,数据备份的安全有了保障,不用担忧数据的丢失。
项目需求:
该项目主要实现的是航天一院内部服务平台搭建 目标是搭建一个安全、高效、稳定服务器群集架构。提供航天各院的服务综合平台。
项目实施:
需求分析:
一、 原共享存储服务器NFS的方式、存在性能瓶颈和单点故障的问题
二、 主NFS存储系统宕机后,报警管理员来人为手工根据同步的日志记录选择最快的NFS存储系统改成主,方案简单可行,可是须要人工处理.不免操做失误或者时间过长。
解决方案:
一、 使用分布式文件存储管理系统MFS替换NFS
二、 目前MFS元数据服务器存在单点问题,所以咱们经过DRBD提供磁盘及时同步,经过HeartBeat提供Failover,来达到高可用
三、采用MFS+DRBD+Heartbeat高可用服务解决方案,这个解决方案能够有效解决主MFS存储系统单点的问题,当主MFS存储宕机后,能够实现把主MFS存储系统从一个主节点切换到另一个备节点,而新的主MFS存储系统还会自动和全部其余的从MFS存储系统进行同步,且新主MFS存储系统的数据和宕机瞬间的主MFS存储系统几乎彻底一致,这个切换过程彻底是自动进行的,从而实现了MFS存储系统的热备方案. 快速故障恢复,提升业务可靠性.
责任描述:
本人在此项目中主要负责,项目现场协调,全部服务器服务平台的搭建,编写了shell脚本,使得服务器部署更加标准化
需求分析:
一、 新方案保证服务性能和I/O知足企业多台终端的快速响应需求。
二、 保证系统长期不间断的稳定运行。保证成本合理性。
三、 知足数据库系统的高可用性和可靠性。
解决方案:
一、 底层5台MySQL 数据库,一主四从. 开启半同步复制.提升数据安全
二、 使用中间件Atlas 实现读写分离与读负载均衡,提升与程序端解耦。
三、 在使用两台服务器搭建LVS+Keepalived 对Atlas 服务器作负载均衡与高可用
四、 搭建一台主MHA服务器管理数据库主库热备问题.
五、 该方案极大减小服务器资源浪费,实现故障30秒切换,极大保证数据库一致性
责任描述:
主要负责全部服务器服务平台的搭建,方案设计,编写脚本。
软件环境:Centos6.8
硬件环境:DELL R710
实施时间:2015年3月
刚进公司不久,后端的NFS服务器在网络请求的高峰期,偶尔会宕机,使WEB服务器的挂载请求没法自动切换到备份服务器,致使web服务器没法正常使用,形成网络服务停止。公司领导为了不之后出现相似的状况要求我作一个解决方案。经过对NFS服务器CPU和内存的负载状况进行观察,以及对NFS服务器以前的主要硬件的负载数据进行查询,并进行仔细分析,我提交了一份以DRBD+heartbeat+NFS的方案来解决现有问题,获得领导的批准由我来实施这个方案。
项目职责:一、负责项目的总体规划和部署;
二、负责heartbeat自动切换脚本的编写;
三、负责NFS服务搭架的主要框架的搭架;
四、经过对故障的模拟,和对元数据服务器、数据存储服务器运行数据的观察,和以前的状况进行数据比较,造成报告;
五、项目实施报告的撰写。
后期改善:
经过配置多条独立的物理链接,以免Heartbeat通讯线路自己存在的单点故障,尽可能地减小“脑裂”的发生机会。经过对ha.cf配置文件中,keepalive等选项的设置,来缩短主从服务器的切换时间。在DRBD中,对replication进程进行调整。处理Master端的坏块问题。
运行环境:CentOS-6.六、DELL R730
主要功能:分离移动端与PC业务
运用技术:Nginx七层负载、tomcat8+jdk1.八、MHA实现mysql高可用(mysql--5.6.17)、
php-5.6.30、shell脚本发送数据检测信息
技术要点:
一、系统环境:CentOS6.5
二、软件工具:squid-3.0
三、项目描述:
以前公司使用的是SNAT上网,形成员工在工做期间利用公司网络带宽浏览与工做无
关的网站视频,致使工做效率下降;迅雷、P2P等应用的泛滥,致使网络拥堵,企业
网带宽资源紧张。
四、职责:
a) 使用squid代理服务对公司员工的上网行为进行管控;
b) 拟定企业上网行为管控方案;
c) 实现对内网的安全防控功能,过滤恶意网页,防范恶意攻击;
d) 限制网络行为,对迅雷、P2P等下载软件进行智能控制;
e) 对上网行为进行精细智能管理。 五、项目成果: 项目实施完毕后,员工工做效率明显提高,保障了企业网带宽资源。