运维自动化-Ansible ( 一 )

前言

每天说运维,到底是干什么的?先看看工做流程呗。通常来讲,运维工程师在一家企业里属于个位数的岗位,甚至只有一个。面对生产中NNN台服务器,NN我的员,工做量也是很是大的。
因此嘛,图中的我好歹也会配置盔甲的。html

image

这就是我主要干的事情(呵呵)python

image

就算你会很厉害的脚本,面对成百上千,甚至上万的主机,效率问题将会困扰你的。
所以,有没有解放的工具呢?linux

Ansible 是什么

Ansible 简单的说是一个配置管理系统(configuration management system)。你只须要可使用 ssh 访问你的服务器或设备就行。它也不一样于其余工具,由于它使用推送的方式,而不是像 puppet 等 那样使用拉取安装agent的方式。你能够将代码部署到任意数量的服务器上!nginx

Ansible能作什么

ansible能够帮助咱们完成一些批量任务,或者完成一些须要常常重复的工做。
好比:同时在100台服务器上安装nginx服务,并在安装后启动它们。
好比:将某个文件一次性拷贝到100台服务器上。
好比:每当有新服务器加入工做环境时,你都要为新服务器部署某个服务,也就是说你须要常常重复的完成相同的工做。
这些场景中咱们均可以使用到ansible。

Ansible特性

 模块化:调用特定的模块,完成特定任务
 有Paramiko,PyYAML,Jinja2(模板语言)三个关键模块
 支持自定义模块
 基于Python语言实现
 部署简单,基于python和SSH(默认已安装),agentless
 安全,基于OpenSSH
 支持playbook编排任务
 幂等性:一个任务执行1遍和执行n遍效果同样,不因重复执行带来意外状况
 无需代理不依赖PKI(无需ssl)
 可以使用任何编程语言写模块
 YAML格式,编排任务,支持丰富的数据结构
 较强大的多层解决方案

Ansible架构

image

Ansible工做原理

image

Ansible主要组成部分功能说明

 PLAYBOOKS:
            任务剧本(任务集),编排定义Ansible任务集的配置文件,由Ansible顺序依次执行,一般是JSON格式的YML文件
 INVENTORY:
            Ansible管理主机的清单/etc/anaible/hosts
 MODULES:
            Ansible执行命令的功能模块,多数为内置的核心模块,也可自定义,ansible-doc –l 可查看模块
 PLUGINS:
            模块功能的补充,如链接类型插件、循环插件、变量插件、过滤插件等,该功能不经常使用
 API:
            供第三方程序调用的应用程序编程接口
 ANSIBLE:
            组合INVENTORY、 API、 MODULES、PLUGINS的绿框,能够理解为是ansible命令工具,其为核心执行工具

注意事项git

 执行ansible的主机通常称为主控端,中控,master或堡垒机
 主控端Python版本须要2.6或以上
 被控端Python版本小于2.4须要安装python-simplejson
 被控端如开启SELinux须要安装libselinux-python
 windows不能作为主控端

安装Ansible

安装方法有不少,这里仅仅以Centos yum安装为例。web

Ansible默认不在标准仓库中,须要用到EPEL源。正则表达式

请自行参考
https://mirrors.aliyun.com/help/centos
#yum install ansible

image

#ansible --version
ansible 2.4.2.0
  config file = /etc/ansible/ansible.cfg
  executable location = /usr/bin/ansible
  python version = 2.7.5

Ansible 功能详解

配置文件

配置文件或指令 描述
/etc/ansible/ansible.cfg 主配置文件,配置ansible工做特性
/etc/ansible/hosts 主机清单
/etc/ansible/roles/ 存放角色的目录
/usr/bin/ansible 主程序,临时命令执行工具
/usr/bin/ansible-doc 查看配置文档,模块功能查看工具
/usr/bin/ansible-galaxy 下载/上传优秀代码或Roles模块的官网平台
/usr/bin/ansible-playbook 定制自动化任务,编排剧本工具
/usr/bin/ansible-pull 远程执行命令的工具
/usr/bin/ansible-vault 文件加密工具
/usr/bin/ansible-console 基于Console界面与用户交互的执行工具

Ansible 配置文件

Ansible 配置文件/etc/ansible/ansible.cfg (通常保持默认)
 [defaults]
 #inventory = /etc/ansible/hosts # 主机列表配置文件
 #library = /usr/share/my_modules/ # 库文件存放目录
 #remote_tmp = $HOME/.ansible/tmp #临时py命令文件存放在远程主机目录
 #local_tmp = $HOME/.ansible/tmp # 本机的临时命令执行目录
 #forks = 5 # 默认并发数
 #sudo_user = root # 默认sudo 用户
 #ask_sudo_pass = True #每次执行ansible命令是否询问ssh密码
 #ask_pass = True      #链接时提示输入ssh密码
 #remote_port = 22     #远程主机的默认端口,生产中这个端口应该会不一样
 #log_path = /var/log/ansible.log #日志
 #host_key_checking = False # 检查对应服务器的host_key,建议取消注释。也就是不会弹出
                                Are you sure you want to continue connecting (yes/no)?

实验规划

实验环境:VMware Workstation Pro 14(试用版)
系统平台:
CentOS Linux release 7.4.1708 (Core)       内核  3.10.0-693.el7.x86_64
最小化安装

实验环境:VMware Workstation Pro 14(试用版)
系统平台:
CentOS release 6.9 (Final)             内核  2.6.32-696.el6.x86_64
最小化安装
主机名 系统版本 IP地址 功能
7-web-0 Centos 7.4 192.168.7.200 Ansible主控端
6-dns-1 Centos 6.9 192.168.7.254 DNS服务器
6-web-1 Centos 6.9 192.168.7.201 服务器
7-web-2 Centos 7.4 192.168.7.202 服务器
7-db-3 Centos 7.4 192.168.7.203 服务器

除了6-DNS-1之外,全部的主机的DNS均指向192.168.7.254shell

正向区域设置
#dig -t axfr hunk.tech

; <<>> DiG 9.8.2rc1-RedHat-9.8.2-0.62.rc1.el6 <<>> -t axfr hunk.tech
;; global options: +cmd
hunk.tech.      600 IN  SOA 6-dns-1.hunk.tech. admin.hunk.tech. 24 720 600 86400 10800
hunk.tech.          600 IN  NS  6-dns-1.hunk.tech.
6-dns-1.hunk.tech.  600 IN  A   192.168.7.254
6-web-1.hunk.tech.  600 IN  A   192.168.7.201
7-db-3.hunk.tech.   600 IN  A   192.168.7.203
7-web-0.hunk.tech.  600 IN  A   192.168.7.200
7-web-2.hunk.tech.  600 IN  A   192.168.7.202
hunk.tech.          600 IN  SOA 6-dns-1.hunk.tech. admin.hunk.tech. 24 720 600 86400 10800

Inventory 主机清单

Ansible必须经过Inventory 来管理主机。Ansible 可同时操做属于一个组的多台主机,组和主机之间的关系经过 inventory 文件配置。express

语法格式:编程

单台主机
green.example.com    >   FQDN
192.168.100.10       >   IP地址
192.168.100.11:2222  >   非标准SSH端口

[webservers]         >   定义了一个组名     
alpha.example.org    >   组内的单台主机
192.168.100.10 

[dbservers]
192.168.100.10       >   一台主机能够是不一样的组,这台主机同时属于[webservers] 

[group:children]     >  组嵌套组,group为自定义的组名,children是关键字,固定语法,必须填写。
dns                  >  group组内包含的其余组名
db                   >  group组内包含的其余组名

[webservers] 
www[001:006].hunk.tech > 有规律的名称列表,
这里表示至关于:
www001.hunk.tech
www002.hunk.tech
www003.hunk.tech
www004.hunk.tech
www005.hunk.tech
www006.hunk.tech

[databases]
db-[a:e].example.com   >   定义字母范围的简写模式,
这里表示至关于:
db-a.example.com
db-b.example.com
db-c.example.com
db-d.example.com
db-e.example.com

如下这2条定义了一台主机的链接方式,而不是读取默认的配置设定
localhost       ansible_connection=local
www.163.com     ansible_connection=ssh        ansible_ssh_user=hunk

最后还有一个隐藏的分组,那就是all,表明所有主机,这个是隐式的,不须要写出来的。

Inventory 参数说明

ansible_ssh_host
      将要链接的远程主机名.与你想要设定的主机的别名不一样的话,可经过此变量设置.

ansible_ssh_port
      ssh端口号.若是不是默认的端口号,经过此变量设置.这种可使用 ip:端口 192.168.1.100:2222

ansible_ssh_user
      默认的 ssh 用户名

ansible_ssh_pass
      ssh 密码(这种方式并不安全,咱们强烈建议使用 --ask-pass 或 SSH 密钥)

ansible_sudo_pass
      sudo 密码(这种方式并不安全,咱们强烈建议使用 --ask-sudo-pass)

ansible_sudo_exe (new in version 1.8)
      sudo 命令路径(适用于1.8及以上版本)

ansible_connection
      与主机的链接类型.好比:local, ssh 或者 paramiko. Ansible 1.2 之前默认使用 paramiko.1.2 之后默认使用 'smart','smart' 方式会根据是否支持 ControlPersist, 来判断'ssh' 方式是否可行.

ansible_ssh_private_key_file
      ssh 使用的私钥文件.适用于有多个密钥,而你不想使用 SSH 代理的状况.

ansible_shell_type
      目标系统的shell类型.默认状况下,命令的执行使用 'sh' 语法,可设置为 'csh' 或 'fish'.

ansible_python_interpreter
      目标主机的 python 路径.适用于的状况: 系统中有多个 Python, 或者命令路径不是"/usr/bin/python",好比  \*BSD, 或者 /usr/bin/python 不是 2.X 版本的 Python.
      咱们不使用 "/usr/bin/env" 机制,由于这要求远程用户的路径设置正确,且要求 "python" 可执行程序名不可为 python之外的名字(实际有可能名为python26).

      与 ansible_python_interpreter 的工做方式相同,可设定如 ruby 或 perl 的路径....

上面的参数用这几个例子来展现可能会更加直观

some_host         ansible_ssh_port=2222     ansible_ssh_user=manager
aws_host          ansible_ssh_private_key_file=/home/example/.ssh/aws.pem
freebsd_host      ansible_python_interpreter=/usr/local/bin/python
ruby_module_host  ansible_ruby_interpreter=/usr/bin/ruby.1.9.3

第一条 Ansible 命令

很重要的一点,主机清单必需要先配置,因为这搭建了内部DNS服务器,因此,这里的主机使用了FQDN名称。

#cat /etc/ansible/hosts 
[web]
6-web-1.hunk.tech
7-web-0.hunk.tech
7-web-2.hunk.tech

[group:children]
dns
db

[dns]
6-dns-1.hunk.tech

[db]
7-db-3.hunk.tech

192.168.7.[200:203]
192.168.7.254
#ansible dns -m ping       # 使用ansible对dns组内的主机进行ping模块测试

image
很是抱歉哦,居然是失败的。为何呢?Ansible是基于ssh进行工做的,那么当ssh一台远程主要的时候,是否是须要输入密码呢?但是这一条指令并无提示输入口令呢

#ansible dns -m ping -k
加上-k选项后,会提示输入ssh密码了。

image

另外,值得注意的是,当指令成功和失败都会有不一样的颜色反映出来,配以changed :false,changed :SUCCESS,可让咱们很是清晰的知道执行的结果。

当主机数量多的时候,输入密码可不是一个好差事呢?前面的章节已经讲过主机之间可使用基于密钥的SSH连接。为了更方便的管理主机,这个章节的实验都用这种方法。

基于key的免密码登陆

#ssh-keygen
#ssh-copy-id 6-web-1.hunk.tech
#ssh-copy-id 6-DNS-1.hunk.tech
#ssh-copy-id 7-web-0.hunk.tech
#ssh-copy-id 7-web-2.hunk.tech
#ssh-copy-id 7-db-3.hunk.tech

如今就不会再提示密码的问题了。

#ansible all -m ping
6-web-1.hunk.tech | SUCCESS
7-web-0.hunk.tech | SUCCESS
7-web-2.hunk.tech | SUCCESS
7-db-3.hunk.tech | SUCCESS 
6-dns-1.hunk.tech | SUCCESS 
192.168.7.201 | SUCCESS 
192.168.7.200 | SUCCESS

是否是很简单呀,Ansible用的指令也不是太多,可使用man ansible和官方网站去查询。http://docs.ansible.com/ansible/latest/

Ansible经常使用命令语法

ansible <host-pattern> [-m module_name] [options]
指令 匹配规则的主机清单 -m 模块名 选项

--version 显示版本
-a 模块参数(若是有)
-m module 指定模块,默认为command
-v 详细过程 –vv -vvv更详细
--list-hosts 显示主机列表,可简写--list
-k, --ask-pass 提示链接密码,默认Key验证
-K,--ask-become-pass 提示使用sudo密码
-C, --check 检查,并不执行
-T, --timeout=TIMEOUT 执行命令的超时时间,默认10s
-u, --user=REMOTE_USER 执行远程执行的用户
-U, SUDO_USER, --sudo-user 指定sudu用户
-b, --become 代替旧版的sudo 切换
ansible-doc: 显示模块帮助
ansible-doc [options] [module...]

-a 显示全部模块的文档
-l, --list 列出可用模块
-s, --snippet 显示指定模块的简要说明

例子:#ansible-doc ping

因为ansible的模块有1378个(2.4.2.0),而且一直在持续更新。所以,这个指令必需要掌握的。
#ansible-doc -l |wc -l
1378

Ansible 主机 匹配列表

通配符

注意用单引号
*  匹配任意字符
#ansible '*' -m ping   等同于 #ansible all -m ping

#ansible '*dns*' -m ping
6-dns-1.hunk.tech | SUCCESS

? 匹配单个字符
#ansible '192.168.7.20?' -m ping
192.168.7.201 | SUCCESS
192.168.7.203 | SUCCESS
192.168.7.202 | SUCCESS
192.168.7.200 | SUCCESS

: 或者
#ansible '192.168.7.201:192.168.7.254' -m ping
192.168.7.201 | SUCCESS
192.168.7.254 | SUCCESS

:& 而且  (逻辑与)
#ansible 'test3:&test' --list

  hosts (1):
    192.168.7.254

:! 逻辑非。在test3组内,可是并不在test组内
#ansible 'test3:!test' --list       > 用到感叹号的时候,记得引号为单引号,不然会被bash解析为历史命令

  hosts (2):
    192.168.7.200
    192.168.7.203

使用正则表达式
~表示后面是正则匹配,注意~后面不能有空格
#ansible '~[67]-(db|dns).*\.hunk.*' --list

  hosts (2):
    6-dns-1.hunk.tech
    7-db-3.hunk.tech

这里写一条正则的坑,咱们在用bash脚本的时候,匹配数字可使用[0-9]或[[:digit:]],在用Ansible的时候,咱们来看下不一样的效果吧

#cat /etc/ansible/hosts 

[web]
6web-1.hunk.tech
7web-0.hunk.tech
7web-2.hunk.tech

[group:children]
dns
db

[dns]
6-dns-1.hunk.tech

[db]
7-db-3.hunk.tech
[test2]
192.168.7.[200:203]
192.168.7.254
[test]
192.168.7.254

[test3]
192.168.7.200
192.168.7.254
192.168.7.203

DNS都是能够正确解析出来的,不要怀疑
6-dns-1.hunk.tech.  600 IN  A   192.168.7.254
6-web-1.hunk.tech.  600 IN  A   192.168.7.201
7-db-3.hunk.tech.   600 IN  A   192.168.7.203
7-web-0.hunk.tech.  600 IN  A   192.168.7.200
7-web-2.hunk.tech.  600 IN  A   192.168.7.202

#ansible '~^[[:digit:]]' --list     有人说这种写法会报错,但是主机都是centos7.4,版本都是同样
  hosts (7):                         这里匹配出7台主机
    192.168.7.200
    192.168.7.201
    192.168.7.202
    192.168.7.203
    192.168.7.254
    6-dns-1.hunk.tech
    7-db-3.hunk.tech

#ansible '~^[0-9]' --list
  hosts (10):                       这里匹配出10台主机
    6web-1.hunk.tech
    6-dns-1.hunk.tech
    7-db-3.hunk.tech
    7web-0.hunk.tech
    7web-2.hunk.tech
    192.168.7.254
    192.168.7.201
    192.168.7.200
    192.168.7.203
    192.168.7.202

#ansible '~^[[:digital:]]' --list
  hosts (10):                       这里匹配出10台主机
    6web-1.hunk.tech
    7web-0.hunk.tech
    7web-2.hunk.tech
    192.168.7.200
    192.168.7.201
    192.168.7.202
    192.168.7.203
    192.168.7.254
    6-dns-1.hunk.tech
    7-db-3.hunk.tech

分享2个正则表达式的网址
https://en.wikipedia.org/wiki/Regular_expression#POSIX_basic_and_extended

python2的
https://docs.python.org/2/library/re.html

不一样软件对正则的表达都不同,仍是用那些通用性强的吧。

[0-9]纯数字
[a-zA-Z0-9]数字和字母

Ansible 的命令执行过程

以 ansible db -m command -a 'ls -l /' -vvv 这条命令为例,根据显示的信息时行解读

1. 加载本身的配置文件,默认/etc/ansible/ansible.cfg
    Using /etc/ansible/ansible.cfg as config file

2.匹配主机清单
    Parsed /etc/ansible/hosts inventory source with ini plugin

3. 加载指令对应的模块文件,如command,生成.py的文件到本机的临时目录,这个目录就是在/etc/ansible/ansible.cfg定义的
    Using module file /usr/lib/python2.7/site-packages/ansible/modules/commands/command.py
    PUT /tmp/tmp4JvsLH TO /root/.ansible/tmp/ansible-tmp-1517301292.6-155771303493861/command.py

4. 经过ansible将模块或命令生成对应的临时py文件,并将该文件传输至远程服务器的对应执行用户$HOME/.ansible/tmp/ansible-tmp-数字/XXX.PY文件,
    这个目录就是在/etc/ansible/ansible.cfg定义的
    ( umask 77 && mkdir -p "` echo /root/.ansible/tmp/ansible-tmp-1517301292.6-155771303493861 `" ....)
    sftp> put /tmp/tmp4JvsLH /root/.ansible/tmp/ansible-tmp-1517301292.6-155771303493861/command.py\n'

5. 给文件+x 权限
    'chmod u+x /root/.ansible/tmp/ansible-tmp-1517301292.6-155771303493861/ /root/.ansible/tmp/ansible-tmp-1517301292.6-155771303493861/command.py && sleep 0'

6. 执行并返回结果
    '/usr/bin/python /root/.ansible/tmp/ansible-tmp-1517301292.6-155771303493861/command.py;

7. 删除临时py文件,sleep 0退出
    rm -rf "/root/.ansible/tmp/ansible-tmp-1517301292.6-155771303493861/" > /dev/null 2>&1 && sleep 0

8.断开远程主机链接
    'Shared connection to 7-db-3.hunk.tech closed.\r\n')

执行结果状态

 绿色:执行成功而且不须要作改变的操做

 ×××:执行成功而且对目标主机作变动

 红色:执行失败

能够在配置文件中定义
[colors]
#highlight = white
#verbose = blue
#warn = bright purple
#error = red
#debug = dark gray
#deprecate = purple
#skip = cyan
#unreachable = red
#ok = green
#changed = yellow
#diff_add = green
#diff_remove = red
#diff_lines = cyan
相关文章
相关标签/搜索