生产力跟不上生产的速度时,就会出现不少问题,如何针对问题进行处理,制定什么样的计划,如何解决就是须要思考的难点?php
IT运维,指的是对已经搭建好的网络,软件,硬件进行维护。运维领域也是细分的,有硬件运维和软件运维html
- 硬件运维主要包括对基础设施的运维,好比机房的设备,主机的硬盘,内存这些物理设备的维护
- 软件运维主要包括系统运维和应用运维,系统运维主要包括对OS,数据库,中间件的监控和维护,这些系统介于设备和应用之间,应用运维主要是对线上业务系统的运维
这里讨论的主要是软件运维的自动化,包括系统运维和应用运维的自动化mysql
平常运维工做是比较繁琐的,研发同窗会常常须要到服务器上查日志,重启应用,或者是说今天上线某个产品,须要部署下环境。这些杂事是传统运维的大部分工做nginx
在部署某应用后,应用不能访问,就会听到开发人员说,在个人环境运行很好的,怎么部署到测试环境后,就不能用了,由于各种环境的类库不统一
还有一种极端状况,运维人员习惯不一样,可能凭本身的习惯来安装部署软件,每种服务器上运行软件的目录不统一web
运维及部署效率低下sql
想一想运维人员须要登录到服务器上执行命令,部署程序,不只效率很低,而且很是容易出现人为的错误,一旦手工出错,追溯问题将会很是不容易docker
无用报警信息过多数据库
常常会收到不少报警信息,多数是无用的报警信息,形成运维人员常常屏蔽报警信
另外若是应用的访问速度出了问题,老是须要从系统、网络、应用、数据库等一步步的查找缘由ruby
资产管理和应用管理混乱服务器
资产管理,服务管理常常记录在excel、文本文件或者wiki中,不便于管理,老员工由于比较熟,不注重这些文档的维护,只有靠每次有新员工入职时,资产才可以更正一次
针对传统运维的痛点,咱们能够知道自动化运维须要支持哪些功能
运维自动化最重要的就是标准化一切
CMDB是全部运维工具的数据基础
Agent方式,能够将服务器上面的Agent程序做定时任务,定时将资产信息提交到指定API录入数据库
其本质上就是在各个服务器上执行
subprocess.getoutput()
命令,而后将每台机器上执行的结果,返回给主机API,而后主机API收到这些数据以后,放入到数据库中,最终经过web界面展示给用户
优势:速度快
缺点:须要为每台服务器部署一个Agent程序
中控机经过Paramiko(py模块)登陆到各个服务器上,而后执行命令的方式去获取各个服务器上的信息
优势:无Agent 缺点:速度慢
若是在服务器较少的状况下,可应用此方法
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
import paramiko
# 建立SSH对象
ssh = paramiko.SSHClient()
# 容许链接不在know_hosts文件中的主机
ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())
# 链接服务器
ssh.connect(hostname='c1.salt.com', port=22, username='root', password='123')
# 执行命令
stdin, stdout, stderr = ssh.exec_command('df')
# 获取命令结果
result = stdout.read()
# 关闭链接
ssh.close()
|
此方案本质上和第二种方案大体是差很少的流程,中控机发送命令给服务器执行。服务器将结果放入另外一个队列中,中控机获取将服务信息发送到API进而录入数据库。
优势:快,开发成本低 缺点:依赖于第三方工具
salstack的安装和配置
1.安装和配置
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
|
master端:
"""
1. 安装salt-master
yum install salt-master
2. 修改配置文件:/etc/salt/master
interface: 0.0.0.0 # 表示Master的IP
3. 启动
service salt-master start
"""
slave端:
"""
1. 安装salt-minion
yum install salt-minion
2. 修改配置文件 /etc/salt/minion
master: 10.211.55.4 # master的地址
或
master:
- 10.211.55.4
- 10.211.55.5
random_master: True
id: c2.salt.com # 客户端在salt-master中显示的惟一ID
3. 启动
service salt-minion start
"""
|
2.受权
1
2
3
4
5
6
|
"""
salt-key -L # 查看已受权和未受权的slave
salt-key -a salve_id # 接受指定id的salve
salt-key -r salve_id # 拒绝指定id的salve
salt-key -d salve_id # 删除指定id的salve
"""
|
3.执行命令
在master服务器上对salve进行远程操做
1
|
salt 'c2.salt.com' cmd.run 'ifconfig'
|
基于API的方式
1
2
3
|
import salt.client
local = salt.client.LocalClient()
result = local.cmd('c2.salt.com', 'cmd.run', ['ifconfig'])
|
参考安装:
http://www.cnblogs.com/tim1blog/p/9987313.html
https://www.jianshu.com/p/84de3e012753
每隔30分钟,经过RPC消息队列将执行的结果返回给用户
以上时自动化的总体的需求分析和思路梳理,最终的落地和执行,须要整个开发team共同努力,相关的code,就须要自行动手搞起来了,加油小伙伴们.
注:文章若有疑问或错误之处,请留言评论指出,必将学习之.