运维工程师在前期是一个很苦逼的工做,在这期间可能干着修电脑、掐网线、搬机器的活,显得没地位!时间也很碎片化,各类零碎的杂事围绕着你,很难体现我的价值,渐渐的对行业很迷茫,以为没什么发展前途。mysql
这些枯燥无味工做的确会令人匮乏,从技术层面讲这些其实都是基本功,对后期的运维工做会无形中带来必定的帮助,由于我也是这么过来的,能深入体会到。因此在这个时期必定要保持积极向上的心态,持续的学习。在将来的某一天,相信会回报给你的!ios
好了,进入正题,根据我多年的运维工做经验,给你们分享下高级运维工程师学习路线。sql
刚开始阶段须要熟悉Linux/Windows操做系统安装,目录结构、启动流程等。数据库
主要学习Linux系统,生产环境中基本都在字符界面完成工做,因此要掌握经常使用的几十个基本管理命令,包括用户管理、磁盘分区、软件包管理、文件权限、文本处理、进程管理、性能分析工具等。编程
OSI和TCP/IP模型必定要熟悉。基本的交换机、路由器概念及实现原理要知道。后端
掌握Shell基本语法结构,能编写简单的脚本便可。数组
最经常使用的网络服务必定得会部署,好比vsftp、nfs、samba、bind、dhcp等。
代码版本管理系统少不了,能够学习下主流的SVN和GIT,能部署和简单使用就能够了。
常常在服务器之间传输数据,因此要会使用:rsync和scp。
数据同步:inotify/sersync。
重复性完成一些工做,可写成脚本定时去运行,因此得会配置Linux下的定时任务服务crond。缓存
每一个公司基本都会有网站,能让网站跑起来,就须要搭建Web服务平台了。
若是是用PHP语言开发的,一般搭建LAMP、LNMP网站平台,这是一个技术名词组合的拼写,分开讲就是得会部署Apache、Nginx、MySQL和PHP。
若是是JAVA语言开发的,一般使用Tomcat运行项目,为了提升访问速度,可使用Nginx反向代理Tomcat,Nginx处理静态页面,Tomcat处理动态页面,实现动静分离。
不是会部署这么简单,还要知道HTTP协议工做原理、简单的性能调优。安全
数据库选择MySQL,它是世界上使用最为普遍的开源数据库。学它准没错!
也要会一些简单的SQL语句、用户管理、经常使用存储引擎、数据库备份与恢复。
想要深刻点,必须会主从复制、性能优化、主流集群方案:MHA、MGR等。
NoSQL这么流行固然也少不了,学下Redis、MongoDB这两个就行了。性能优化
安全很重要,不要等到系统被了,再作安全策略,此时已晚!因此,当一台服务器上线后应立刻作安全访问控制策略,好比使用iptables限制只容许信任源IP访问,关闭一些无用的服务和端口等。
一些常见的类型必定得知道啊,不然怎么对症下药呢!好比CC、DDOS、ARP等。
监控必不可少,是及时发现问题和追溯问题的救命稻草。能够选择学习主流的Zabbix开源监控系统,功能丰富,能知足基本的监控需求。监控点包括基本服务器资源、接口状态、服务性能、PV/UV、日志等方面。
也能够弄个仪表盘展现几个实时关键的数据,好比Grafana,会很是炫酷。
Shell脚本是Linux自动完成工做的利器,必须得熟练编写,因此得进一步学习函数、数组、信号、发邮件等。
文本处理三剑客(grep、sed、awk)得玩6啊,Linux下文本处理就期望它们了。
Shell脚本只能完成一些基本的任务,想要完成更复杂些的任务,好比调用API、多进程等。就须要学高级语言了。
Python是运维领域使用最多的语言,简单易用,学它准没错!此阶段掌握基础就能够了,例如基本语法结构、文件对象操做、函数、迭代对象、异常处理、发邮件、数据库编程等。
用户老喊着访问网站慢,看看服务器资源还很富裕啊!网站访问慢也许不是服务器资源饱和致使的,影响因素不少,例如网络、转发层数等。
对于网络,存在南北通讯问题,之间访问会慢,这个可使用CDN解决,同时缓存静态页面,尽量将请求拦截在最上层响应,减小后端请求和响应时间。
若是不用CDN,也可使用Squid、Varnish、Nginx这样的缓存服务实现静态页面缓存,放到流量入口处。
单台服务器终究资源有限,抵抗高访问量确定是没法支撑的,解决此问题最关键的技术就是采用负载均衡器,水平扩展多台Web服务器,同时对外提供服务,这样就成倍扩展性能了。负载均衡器主流开源技术有LVS、HAProxy和Nginx。必定要熟悉一两个!
Web服务器性能瓶颈解决了,数据库更为关键,仍是采用集群,就拿学的MySQL来讲,能够一主多从架构,在此基础上读写分离,主负责写,多从负责读,从库可水平扩展,前面再来个四层负载均衡器,承载千万级PV,妥妥的!
高可用软件也得会,避免单点的利器,主流的有Keepalived、Heartbeat等。
网站图片咋这么多呢!NFS共享存储支撑不过了,处理很慢,好弄!上分布式文件系统,并行处理任务,无单点,高可靠,高性能等特性,主流的有FastDFS、MFS、HDFS、Ceph、GFS等。初期的话我建议学习下FastDFS,能知足中小规模需求。
硬件服务器资源利用率很低,甚是浪费!能够把空闲多的服务器虚拟化,弄成不少个的虚拟机,每一个虚拟机就是一个完整的操做系统。能够很大程度提升资源利用率。建议学习开源的KVM+OpenStack云平台。
虚拟机做为基础平台还能够,但应用业务弹性伸缩也过重量了吧!启动好几分钟,文件又这么大,快速扩展太费劲了!
好说,上容器,容器主要特色就是快速部署和环境隔离。一个服务封装到镜像中,分分钟钟可建立几百个容器。
主流的容器技术非Docker莫属了。
固然,生产环境单机Docker大多数状况下是没法知足业务需求的,能够部署Kubernetes、Swarm集群化管理容器,造成一个大的资源池,集中管理,为基础架构提供有力的支撑。
学习Docker不妨看看这个视频教程,学员评价仍是不错的:点我
反反复复重复的工做,不但提升不了效率,价值也得不到体现。
一切运维工做标准化,例如环境版本、目录结构、操做系统等统一。在标准化基础上才能更方面的自动化,点点鼠标或者敲几个命令便可完成一项复杂的工做任务,爽哉爽哉!
所以,全部的操做尽量自动化,减小人为失误,提升工做效率。
主流服务器集中管理工具:Ansible、Saltstack
这两个选择任意一个就行。
持续集成工具:Jenkins
能够再深刻学习下Python开发,掌握面向对象编程。
最好也掌学习一个Web框架开发网站,例如Django、Flask,主要是开发运维管理系统,将一些复杂的流程写到平台中,再集成集中管理工具,可打造一个属于运维本身的管理平台。
具体学习思路可看×××公众号的历史文章:《启示录:如何打造运维自动化平台》
日志也很重要,按期的分析,可发现潜在隐患,提炼出有价值的东西。
开源的一套日志系统:ELK
学会部署使用,给开发提供日志查看需求。
只会部署是远远不够的,性能优化能最大化提高服务承载量。
这块也是比较难的,也是高薪的关键点之一,为了钱也得下点功夫学习啊!
能够从硬件层、操做系统层、软件层和架构层维度展开思考。
小结:
武器类型 | 武器名称 |
---|---|
文本处理 | grep、sed、awk |
数据传输 | Rsync、Scp、Inodify/Sersync |
进程管理 | Supervisor |
性能分析 | top、free、df、iftop、iostat、vmstat、dstat、sar、sysdig |
网络服务 | vsftp、nfs、samba、bind、dhcp、postfix |
Web服务 | Apache、Nginx、Tomcat、JBoss、Resin |
数据库 | MySQL、MariaDB、Percona Server for MySQL |
NoSQL | Redis、MongoDB |
消息中间件 | RabbitMQ、ActiveMQ |
版本管理 | SVN、Git |
静态缓存 | Squid、Varnish、Nginx |
负载均衡 | LVS、HAProxy、Nginx |
高可用软件 | Keepalived、Heartbeat、DRBD、corosync+pacemaker |
集中管理工具 | Ansible、Saltstack、Chef、Puppet |
虚拟化与云平台 | KVM、Xen、Docker、Kubernetes、Openstack、Cloudstack |
自动装机 | Kickstart、Cobbler |
抓包分析 | Tcpdump、Wireshark |
持续集成 | Jenkins、Gitlab |
MySQL代理 | Altas、Cobar、Mycat |
压测 | ab、fio、sysbench、mysqlslap |
安全检查 | chrootkit、rkhunter |
日志系统 | ELK |
监控 | Zabbix、Cacti、Nagios、Grafana |
学习是一个很漫长的过程,是咱们每一个人须要用一辈子去坚持的事业。
贵在坚持,难在坚持,成在坚持!
没有目标的不叫工做,没有量化的不叫目标。
每到一个阶段,制定一个目标。
好比:先定一个能达到的小目标,挣它一个亿!
学会分享,技术的价值在于能有效地将知识传递到外界,让更多的人知道它。只要人人都拿出一点东西来,想一想会变成什么样?