Nebula Graph 的 Ansible 实践

本文首发于 Nebula Graph 公众号 NebulaGraphCommunity,Follow & 看大厂图数据库技术实践html

Nebula Graph 的 Ansible 实践

背景

在 Nebula-Graph 的平常测试中,咱们会常常在服务器上部署 Nebula-Graph。为了提升效率,咱们须要一种工具,能帮咱们作到快速部署,主要的需求:python

  • 可使用非 root 帐户部署 Nebula Graph,这样咱们能够针对这个用户设置 cgroup 作资源限制。
  • 能够在操做机上更改配置文件,而后分发到部署的集群上,方便咱们作各类调参的测试。
  • 可使用脚本调用,方便之后咱们继承在测试的平台或工具上。

工具选择上,早期有 Fabric 和 Puppet,比较新的工具备 Ansible 和 SaltStack。git

Ansible 在 GitHub 上有 40K+ star, 并且在 2015年被 Red Hat 收购,社区比较活跃。不少开源项目都提供了 Ansible 的部署方式,好比 Kubernetes 中的 kubespray和 TiDB 中的 tidb-ansiblegithub

综合下来,咱们使用 Ansible 来部署 Nebula Graph。shell

Ansible 介绍

特色

Ansible 是开源的,自动化部署工具(Ansible Tower 是商业的)。具备如下的几个特色:数据库

  • 默认协议是基于 SSH,相比于 SaltStack不 须要额外部署 agent。
  • 使用 playbook, role, module 来定义部署过程,比较灵活。
  • 操做行为幂等。
  • 模块化开发,模块比较丰富。

优缺点比较明显api

  • 使用 SSH 协议,优势是大多数机器默认只要有帐号密码就能够经过 Ansible 完成部署,而缺点性能上会差一些。
  • 使用 playbook 来定义部署过程,Python 的 Jinja2 做为模板渲染引擎,对于熟悉的人来讲会比较方便,而对于没有使用过的人,会增长学习成本。

综上,适用于小批量机器的批量部署,不须要关心额外部署 agent 的场景,和咱们的需求比较匹配。安全

部署逻辑

一般为了离线部署,能够把机器分为 3种角色。bash

  • Ansible 执行机:运行 Ansible 的机器,须要能经过 SSH 连到全部机器。
  • 有外网的资源机:运行须要链接外网的任务,好比下载 RPM 包。
  • 服务器:即运行服务的服务器,能够网络隔离,经过执行机来部署

Nebula Graph 的 Ansible 实践

任务逻辑

Ansible 中,主要有三种层次的任务:服务器

  • Module
  • Role
  • Playbook

Module 分为 CoreModule 和 CustomerModule,是 Ansible 任务的基本单元。

在运行任务的时候,首先 Ansible 会根据 module 的代码,将参数代入,生成一个新的 Python 文件,经过 SSH 放到远程的 tmp 文件夹,而后经过 SSH 远程执行 Python 将输出结果返回,最后把远程目录删除。

Nebula Graph 的 Ansible 实践

# 设置不删除 tmp 文件
export ANSIBLE_KEEP_REMOTE_FILES=1
 # -vvv 查看 debug 信息
ansible -m ping all -vvv
<192.168.8.147> SSH: EXEC ssh -o ControlMaster=auto -o ControlPersist=30m -o ConnectionAttempts=100 -o UserKnownHostsFile=/dev/null -o StrictHostKeyChecking=no -o KbdInteractiveAuthentication=no -o PreferredAuthentications=gssapi-with-mic,gssapi-keyex,hostbased,publickey -o PasswordAuthentication=no -o 'User="nebula"' -o ConnectTimeout=10 -o ControlPath=/home/vesoft/.ansible/cp/d94660cf0d -tt 192.168.8.147 '/bin/sh -c '"'"'/usr/bin/python /home/nebula/.ansible/tmp/ansible-tmp-1618982672.9659252-5332-61577192045877/AnsiballZ_ping.py && sleep 0'"'"''
复制代码

能够看到有这样的日志输出,AnsiballZ_ping.py 就是根据 module 生成的 Python 文件,能够登陆到那台机器,执行 Python 语句看一下结果。

python3 AnsiballZ_ping.py

#{"ping": "pong", "invocation": {"module_args": {"data": "pong"}}}
复制代码

返回了运行 Python 文件的标准输出,而后 Ansible 再对返回的结果作额外处理。

Role 是串联 module 的一系列任务,能够经过 register 来传递上下文参数。

典型例子:

  1. 建立目录
  2. 若是建立目录成功,继续安装,不然退出整个部署工程。

Playbook 是组织部署机器和 role 之间的关联。

经过在 inventory 对不一样机器进行分组,对不一样分组使用不一样的 role 来部署,完成很是灵活的安装部署任务。

当 playbook 定义好以后,不一样的环境,只要变动 inventory 中的机器配置,就能够完成同样的部署过程。

模块定制

自定义 filter

Ansible 使用 Jinja2 做为模板渲染引擎,能够用 Jinja2 自带的 filter ,好比

# 使用 default filter,默认输出 5

ansible -m debug -a 'msg={{ hello | default(5) }}' all
复制代码

有时候,咱们会须要自定义的 filter 来操做变量,典型的场景就是 nebula-metad 的 地址 --meta_server_addrs

  • 当只有 1 个 metad 的时候,格式是 metad1:9559
  • 当有 3 个 metad 的时候,格式是 metad1:9559,metad2:9559,metad3:9559

在 ansible playbook 的工程下,新建 filter_plugins 目录,建立一个 map_fomat.py Python文件,文件内容:

# -*- encoding: utf-8 -*-
from jinja2.utils import soft_unicode

def map_format(value, pattern):
    """ e.g. "{{ groups['metad']|map('map_format', '%s:9559')|join(',') }}" """
    return soft_unicode(pattern) % (value)

class FilterModule(object):
    """ jinja2 filters """
    def filters(self):
        return {
            'map_format': map_format,
        }
复制代码

{{ groups['metad']|map('map_format', '%s:9559')|join(',') }} 即为咱们想要的值。

自定义 module

自定义 module 须要符合 Ansible 框架的格式,包括获取参数,标准返回,错误返回等。

写好的自定义 module,须要在 ansible.cfg 中配置 ANSIBLE_LIBRARY,让 ansible 可以获取到。

具体参考官网:ansible-docs.readthedocs.io/zh/stable-2…

Nebula Graph 的 Ansible 实践

由于 Nebula Graph 自己启动并不复杂,使用 Ansible 来完成 Nebula-Graph 的部署十分简单。

  1. 下载 RPM 包。
  2. 复制 RPM 包到部署机,解压后,放到目的文件夹。
  3. 更新配置文件。
  4. 经过 shell 启动。

使用通用的 role

Nebula Graph 有三个组件,graphd、metad、storaged,三个组件的命名和启动使用同样的格式,可使用通用的 role,graphd、metad、storaged 分别引用通用的 role。

一方面更容易维护,另外一方面部署的服务更有细粒度。好比 A B C 机器部署 storaged, 只有 C 机器部署 graphd,那 A B 机器上,就不会有 graphd 的配置文件。

# 通用的 role, 使用变量 install/task/main.yml
- name: config {{ module }}.conf
  template:
    src: "{{ playbook_dir}}/templates/{{ module }}.conf.j2"
    dest: "{{ deploy_dir }}/etc/{{ module }}.conf"
    
# graphd role,将变量传进来 nebula-graphd/task/main.yml
- name: install graphd
  include_role:
    name: install
  vars:
    module: nebula-graphd
复制代码

在 playbook 中,graphd 的机器组来运行 graphd 的 role,若是 A B 不在 graphd 的机器组,就不会将 graphd 的配置文件上传。

这样部署后,就不能使用 Nebula-Graph 的 nebula.service start all 来所有启动,由于有的机器上会没有 nebula-graphd.conf 的配置文件。相似的,能够在 playbook 中,经过参数,来指定不一样的机器组,传不一样的参数。

# playbook start.yml
- hosts: metad
  roles:
    - op
  vars:
    - module: metad
    - op: start

- hosts: storaged
  roles:
    - op
  vars:
    - module: storaged
    - op: start

- hosts: graphd
  roles:
    - op
  vars:
    - module: graphd
    - op: start
复制代码

这样会至关于屡次 ssh 去执行启动脚本,虽然执行效率没有 start all 更好,可是服务的启停会更为灵活。

Nebula Graph 的 Ansible 实践

使用 vars_prompt 结束 playbook

当只想更新二进制,不想删除数据目录的时候,

能够在 remove 的 playbook 中,添加 vars_prompt 二次确认,若是二次确认了,才会删除数据,不然会退出 playbook。

# playbook remove.yml
- hosts: all
  vars_prompt:
    - name: confirmed
      prompt: "Are you sure you want to remove the Nebula-Graph? Will delete binary only  (yes/no)"
 
  roles:
    - remove
复制代码

而在 role 里,会校验二次确认的值

# remove/task/main.yml
---
- name: Information
  debug:
    msg: "Must input 'yes', abort the playbook "
  when:
    - confirmed != 'yes'

- meta: end_play
  when:
    - confirmed != 'yes
复制代码

效果如图,删除时能够二次确认,若是不为 yes,就会取消执行此次的 playbook,这样能够只删除二进制,而不删除 nebula 集群的数据。

Nebula Graph 的 Ansible 实践

交流图数据库技术?加入 Nebula 交流群请先填写下你的 Nebulae 名片,Nebula 小助手会拉你进群~~

推荐阅读

相关文章
相关标签/搜索