初级篇:
linux运维人员经常使用工具拓扑详见:html
1.rsync工具java
不少地方常常会用到rsync工具,实施几台服务器的同步效果。咱们公司就是使用这个工具完成服务器的youxi的服务端和客户端同步,有几个文章例子:python
rsync 强化技术(手动修改端口开启防火墙的状况下)而且经过脚本只同步须要的服务器inotify+rsync+mutt+msmtp 实现linux文件或者目录自动更新而且实现发邮件给管理员。
2.网络服务mysql
服务有不少种,每间公司都会用到不一样的,但基础的服务确定要掌握,如FTP、DNS、SAMBA、邮件, 这几个大概学一下就行,LAMP和LNMP是必需要熟练,我所指的不是光会搭建,而是要很熟悉里面的至关配置才行,由于公司最关键的绝对是Web服务器,因此Nginx和Apache要熟悉,特别是Nginx必定要很熟悉才行,至少有些公司还会用Tomcat,这个也最好学一下。linux
其实网络服务方面不用太担忧,通常公司的环境都已经搭建好,就算有新服务器或让你整改,公司会有相应的文档让你参照来弄,不会让你乱来的,但至少相关的配置必定要学熟,并且确定是编译安装多,那些模块要熟悉一下他的做用,特别是PHP那些模块。ios
这面2点只是基础,也是必要条件,不能说是工具,如下才是真正的要掌握的工具。nginx
Samba文件共享服务(共享脚本 让你工做更轻松)
Linux web服务安装apache 思路 (源码编译,本身定义服务)
FTP(持虚拟用户,而且每一个虚拟用户能够具备独立的属性配置)
linux 下构建DHCP服务器
3.脚本语言web
Shell脚本和另外一个脚本语言,Shell是运维人员必须具有的,不懂这个连入职都不行,至少也要写出一些系统管理脚本,最简单也得写个监控CPU,内存比率的脚本吧,这是最最最基本了,别觉得会写那些猜数字和计算什么数的,这些没什么做用,只做学习意义,写系统脚本才是最有意义,而另外一个脚本语言是可选的,通常是3P,即Python、Perl和PHP,PHP就不须要考虑了,除非你要作开发,我我的建议学Python会比较好,难实现自动化运维,Perl是文本处理很强大,反正这两个学一个就好了。面试
Shell(一) 入门到复杂 本身作的各类脚本实例与解释
Shell(二)入门到复杂 脚本实例(计算器)
4.sed和awk工具正则表达式
这两个工具必需要掌握,同时还要掌握正则表达式,这个就痛苦了,正则是最难学的表达式,但结合到sed和awk中会很强大,在处理文本内容和过滤Web内容时十分有用,不过在学Shell的同时通常会常常结合用到的,因此学第3点就会顺便学第4点。
sed 简明教程https://coolshell.cn/articles/9104.html
5.文本处理命令
sort 、tr、cut、paste、uniq、tee等必学,也是结合第3点脚本语言时一并学习的。
6.数据库
首选MySQL,别问我为何不学SQL Server和Oracle,由于Linux用得最多绝对是MySQL,增删改查必学,特别要学熟查,其它方面可能不太须要,由于运维人员使用最多仍是查,哪些优化和开发语句不会让你弄的。
MySQL(手动编译详细思路,以及增删改查、受权、备份还原)
7.防火墙
防火墙也算是个难点,说难不难,说易不易,最重要弄懂规则,若是学过CCNA的朋友可能会比较好学,由于iptables也有NAT表,原理是同样的,而FILTER表用得最多,反正不学就确定不合格。
防火墙(一)主机型防火墙
防火墙(二)SNAT和DNAT
8.监控工具
我我的建议,最好学这3个:Cacti,Nagios,Zabbix,企业用得最多应该是Nagios和 Zabbix,反正都学吧,但Nagios会有点难,由于会涉及到用脚本写自动监控,那个地方很难。
CentOS 6.2+Nginx+Nagios,手机短信和QQ邮箱提醒
服务器集中检测Cacti
9.集群和热备
这个很重要,确定要懂的,但到了公司就不会让你去弄,由于新手基本不让你碰,集群工具备不少,最好学是LVS,这是必学,最好也学Nginx集群、反向代理,还有热备,这个就更多工具能实现了,像我公司是本身开发热备工具的。MySQL热备也要学,就是主从复制,这个要学懂整个流程一点也不容易,只照着作根本没意思。
MySQL主从同步,双主同步,若是服务器意外挂机,不一样步怎么办
MySQL高性能压力测试(总结了很久)
Nginx 缓存配置及报错解决
10.数据备份
工具备不少,但至少要把RAID的原理弄懂,特别是企业最经常使用的1+0或0+1,本身作实验也要弄出来,备份工具备不少,如tar、dump,最好多了解一下。
学会以上10点,应该能够入门了,有些技术会比较难学,例如Apache和Nginx中还有些很重要的技术,如系统调优、服务优化、程序优化,这些在没接触工做前很难学习到的,因此先把这10点学了吧,估计要学熟至少3个月不止,脚本部分会交很吃力了,我建议是先学熟shell,等工做后再学另外一门脚本语言,这样会比较好。
以上就是踏入linux运维工程师须要掌握的工具,还有不少工具要掌握的,但在学习环境中是很难学到,最后我再提醒一下,这里所指的工具至关于技能,而不是像Windows或Ubuntu的图形化工具,还有学linux就别装图形界面,这样虚拟机就不用吃太多内存,并且绝对不建议在真机上装Linux,根本达不到学习效果。
中级篇
这部分来自我本身的面试经历和面试别人的经历总结。先附上运维思路拓扑图:
有些人认为,其实运维就是部署某个软件,设置些基础功能,就算会运维了。
举个例子:安装LAMP,LNMP,就感受部署方法我都掌握了。其实网上大多数都有一键安装脚本啥的根本没有啥技术含量,在面试官眼里,这些都不是你的亮点。基本到了公司通常环境架构都是部署好的,不多须要你去变更环境架构。就算你安装好 LNMP 架构你熟悉里面的原理吗?熟悉 Nginx 优化吗?熟悉 MySQL 优化吗?
再举个例子:我面试遇到的问题,面试官问你既然熟悉 LNMP 架构,那么 Nginx 反向代理的做用。
你应该不是说出懂这个软件和配置,你尽量的说怎么优化,怎么深刻提升网站性能。
使用反向代理能够理解为7层应用层的负载均衡,使用负载均衡以后能够很是便捷的横向扩展服务器集群,实现集群总体并发能力、抗压能力的提升。
一般反向代理服务器会带有本地 Cache 功能,经过静态资源的 Cache,有效的减小后端服务器所承载的压力,从而提升性能。
下面说说运维在工做中须要掌握的核心技术。注意,这是在工做中掌握的,在学习中很难掌握。
1.第一条最主要的排错
分析部分程序不能运行或没有按预想结果运行的缘由,对程序运行跟踪,查看系统调用的过程。
较深刻的系统瓶颈点分析。
查看剩余内存:
ree -m
#-/+ buffers/cache: 6458 1649
#6458M为真实使用内存 1649M为真实剩余内存(剩余内存+缓存+缓冲器)
#linux会利用全部的剩余内存做为缓存,因此要保证linux运行速度,就须要保证内存的缓存大小
系统信息:
硬件信息:
使用分析系统分析web日志(如逆火软件)
分析系统性能瓶颈点(IO/Memory/CPU,经常使用工具,top命令中shift组合键的特殊用Sar/vmstat/iostat/ipcs)
日志管理经常使用命令:
2.优化
优化能够说是运维最吃香的技能,基本会优化的运维广泛工资很高,并且优化是要承担风险的,并非网上搜个文章改一下配置文件或者参数就叫优化了,这样很容易形成宕机。
优化是根据实际的现场环境硬件各个参数进行部分优化,提升软件性能和网站性能。这个我只能讲半知半解,当时优化MySQL和Tomcat参数也是根据网上文章和官网文档查找参数在虚拟机上测试而后查看性能。
成本优化,性能优化。这里我给出 Tomcat 优化JVM参数(作过相应测试才放到现场环境的):(记住无监控不调优)
-标准参数,全部jvm都应该支持
-X 非标,每一个jvm实现都不一样
-XX 不稳定参数,下一版本可能会取消
serial collector 单线程 序列化
parallel collector 多线程
启动 jvisualvm.exe 监控 dump 内存溢出
-Xms:初始堆大小
-Xmx:最大堆大小
-Xss:线程栈大小
-XX:NewSize=n:设置年轻代大小
-XX:NewRatio=n:设置年轻代和年老代的比值,如3, 标示年轻代:年老代比值1:3,年轻代占整个年轻代年老代和的1/4
-XX:SurvivorRatio=n:年轻代中的eden区与2个Survivor区的比值。
-XX:MaxPermSize=n:设置持久代大小
收集器设置
-XX:+UseSerialGC:设置串行收集器
-XX:+UseParallelGC:设置并行收集器
-XX:+UseConcMarkSweepGC:设置并发收集器
回收统计信息
-XX:+PrintGC
-XX:+PrintGCDetails
-Xloggc:filename
Tocmat 优化,确认有几个JVM虚拟机
set JAVA_OPTS=
-Xms4g
-Xmx4g
-Xss512k
-XX:+AggressiveOpts 进攻型的优化选项,全部优化项都加上
-XX:+UseBiasedLocking 优化锁,基本都要选上,偏执锁
-XX:permSize=64m 原始区大小,最大300m 类多就设置大一点
-XX:MaxPermSize=300m
-XX:+DisableExplicitGC //System.gc() 不显示调用gc
-XX:+UseConcMarkSweepGC 使用cms缩短相应时间,并发收集,低停顿
-XX:+UseParNewGC 并行收集新生代的垃圾
-XX:+CMSParallelRemarkEnabled 在使用UseParNewGC的状况下,尽可能减小mark的时间
-XX:+UseCMSCompactAtFullCollection 使用并发收集器时,开启对年老代的压缩,使碎片减小
-XX:LargePageSizelnBytes=128m 内存分页大小对性能的提高
-XX:+UseFastAccessorMethods get/set方法转成本地代码
-Djava awt headless=true 修复linux下tomcat处理图标时可能产生的bug
内存调优:
Tomcat 前任何参数没参加大概每秒605,调优后大概每秒435,接近3倍的结果。
3.开发技能
优选 Shell 和 Python,如今 Shell 没法知足你的需求或者效率很低,那么选择自动化 Python 是最好的选择。如今广泛招聘需求要求,会写 Shell 或者 Python、Perl 脚本,我的选择仍是选 Python。
Python 这门语言上手比较快,容易理解。在服务器管理工具上很是丰富,配置管理(Saltstack) 批量执行(Fabric、Saltstack) 监控(Zenoss、Nagios 插件) 虚拟化管理( python-libvirt) 进程管理 (Supervisor) 云计算(OpenStack) …… 还有大部分系统 C 库都有 Python 绑定。
对于流程肯定的事情,最终必定是归入系统管理的体系,写成程序,成为系统的一部分。而不是没法复用游离与总体的各类脚本。
随着云计算时代的来临,中小型公司不须要运维了,大型公司没有工程开发能力的运维,是没有竞争力的。
最重要的学好 Python 能够涨工资,能够涨工资,能够涨工资。(重要的事情说三遍~)目前本人也是在学 Python,正在把之前 Shell 脚本的实例转换成 Python 脚本。
意识篇
1.安全意识
运维人员的权限很大,因此必定要保证账号/私钥的安全。
最好使用加密工具存储。好比Truecrypt、lpassword。
基于本地存储。切勿用网盘,也不建议用lastpass等
SSH私钥添加密码
2.磨刀意识
关于任何操做配置,最好先搞明白操做或配置的原理,而后再去操做。应一句话叫作“磨刀不误砍柴功”,并且对于相似的操做能够触类旁通。
3.计划意识
复杂的变动操做好比多台主机以及牵涉到san存储,最好先做 操做计划,写计划文档,详细致每条命令,而后请高手帮忙审核。 这样能最大程度使整个操做过程安全。若是是重要的客户业务系统,操做最好有回退方案,而一旦变动失败,客户能够在短期内将业务回退。
4.记录分享意识
遇到本身认为较特殊的案例时,记得要写案例过程及分析的文档。也方便本身之后翻看,或者和其余兄弟分享,做知识的传播以便于你们之后都能少走弯路。
5.监控意识
运维来讲,监控是很是重要的,监控是发现系统各类异常的眼睛,因此运维应该和监控紧密配合。
6.业务意识
尽可能了解维护的各主机上业务类型,以及各主机业务之间的关联性。由于任何维护工做都是为主机能提供业务服务的,当某业务中断,能最快的知道与此业务相关的主机群,从而缩小故障排查范围,最快定位故障。并非你技术很牛,学的技术不少很熟,就不表明你不须要运维意识,其实领导很看重运维意识的,例若有没有作好备份、权限分配问题、平台测试状况、故障响应时间等,这些都是意识,而不是你学了不少技术自认大牛了,平台发现故障你又没什么大不子,觉得很简单的问题喜欢处理就处理,不须要向其它部门反馈等,领导不是看你的技术如何,而是看你的运维意识如何,你没运维意识,技术再牛也没用,只会让其它部门的人跟你不协调。要知道作IT这行是苦逼的,须要无尽的学习,不学习只会被淘汰,不想被年轻的淘汰,就只能不断增值本身,否则不是你工资没法提高,而是你没法再从事这行。这个世界,在悄悄惩罚不改变的人……
面试篇
一、什么是运维?什么是youxi运维?
二、在工做中,运维人员常常须要跟运营人员打交道,请问运营人员是作什么工做的?
三、如今给你三百台服务器,你怎么对他们进行管理?
四、简述raid0 raid1 raid5 三种工做模式的工做原理及特色。
五、LVS、Nginx、HAproxy有什么区别?工做中你怎么选择?
六、Squid、Varinsh和Nginx有什么区别,工做中你怎么选择?
七、Tomcat和Resin有什么区别,工做中你怎么选择?
八、什么是中间件?什么是jdk?
九、讲述一下Tomcat800五、800九、8080三个端口的含义?
十、什么叫CDN?
十一、什么叫网站灰度发布?
十二、简述DNS进行域名解析的过程?
1三、RabbitMQ是什么东西?
1四、讲一下Keepalived的工做原理?
1五、讲述一下LVS三种模式的工做过程?
1六、mysql的innodb如何定位锁问题,mysql如何减小主从复制延迟?
1七、如何重置mysql root密码?
1八、lvs/nginx/haproxy优缺点
1九、mysql数据备份工具
20、keepalived的工做原理和如何作到健康检查
2一、统计ip访问状况,要求分析nginx访问日志,找出访问页面数量在前十位的ip
2二、使用tcpdump监听主机为192.168.1.1,tcp端口为80的数据,同时将输出结果保存输出到tcpdump.log
2三、如何将本地80 端口的请求转发到8080 端口,当前主机IP 为192.168.2.1
2四、简述raid0 raid1 raid5 三种工做模式的工做原理及特色
2五、你对如今运维工程师的理解和以及对其工做的认识
2六、实时抓取并显示当前系统中tcp 80端口的网络数据信息,请写出完整操做命令
2七、Linux系统中病毒怎么解决?
2八、发现一个病毒文件你删了他又自动建立怎么解决?
2九、说说TCP/IP的七层模型
30、你经常使用的Nginx模块,用来作什么
3一、请列出你了解的web服务器负载架构
3二、查看http的并发请求数与其TCP链接状态
3三、用tcpdump嗅探80端口的访问看看谁最高
3四、写一个脚本,实现判断192.168.1.0/24网络里,当前在线的IP有哪些,能ping通则认为在线
3五、已知 apache 服务的访问日志按天记录在服务器本地目录/app/logs 下,因为磁盘空间紧张
如今要求只能保留最近 7 天的访问日志!请问如何解决? 请给出解决办法或配置或处理命令
建立文件脚本:
3六、如何优化 Linux系统(能够不说太具体)?
3七、请执行命令取出 linux 中 eth0 的 IP 地址(请用 cut,有能力者也可分别用 awk,sed 命令答)
3八、请写出下面 linux SecureCRT 命令行快捷键命令的功能?
3九、天天晚上 12 点,打包站点目录/var/www/html 备份到/data 目录下(最好每次备份按时间生成不一样的备份包)
40.常见的Linux发行版本都有什么?你最擅长哪个?它的官网网站是什么?说明你擅长哪一块?
41.Linux开机启动流程详细步骤是什么?系统安装完,忘记密码如何破解?
42.企业中Linux服务器系统分区标准是什么?(硬盘为300G,内存16G)
43.某一天忽然发现Linux系统文件只读,该怎么办呢?完整操做步骤。
44.安装一台系统使用DVD光盘安装,如何安装50台Linux系统如何安装呢?思考一下。
45.用虚拟机安装了一台Linux系统,忽然想克隆一台服务器,克隆后发现没法上网,如何解决?
46.Linux网卡配置文件路径是什么?要使服务器上外网,必须知足的条件有哪些?须要配置什么?
47.通常可使用什么软件远程linux服务器?经过什么上传文件和下载文件?
48./mnt目录主要用于什么?/root目录跟root用户有什么关系?/根目录与/boot目录有什么联系?
49.某一天误操做,执行了rm-rf*,会有哪些状况发生?请举例。
50.在/tmp/目录下建立test.txt文件,内容为:Hello,World!,用一个命令写出来。
51.给test.txt文件除全部者以外增长执行权限,最终以数字写出文件的权限。
52.用vi命令编辑test.txt,如何跳转到末行,首行,行首、行末,如何在光标行下一行插入
如何复制5行,删除10行,查找jingfeng的字符、把jingfeng替换为jfedu.net
53.查找linux系统下以txt结尾,30天没有修改的文件大小大于20K同时具备执行权限的文件并备份到/data/backup/目录下。
54.当前test.txt所属的用户为root,组为abc,请将test.txt使拥有者为abc,组为root,写出命令。
55.如何修改Linux启动级别为字符模式并永久生效,如何临时、永久关闭selinux及防火墙,请分别写出操做方法。
56.每次开机在/tmp目录下建立一个当天的日期文件夹(提示:当前日期表示的方法为:date+%Y%m%d)
57.如何查看文件内容,命令有哪些?查看文件第1行到3行,查看文件最后一行。
58.查看linux服务器IP的命令,同时只显示包含ip所在的行打印出来。
59.将普通用户test加入root组的命令是?
来源:http://www.javashuo.com/article/p-ulykvrqs-kn.html因为篇幅影响阅读质量,须要答案的小伙伴能够添加微信13272413561备注“答案”免费获取哦!!!