Ambari 自定义服务集成原理介绍

时间 2020-01-03

标签 ambari 自定义服务集成原理介绍繁體版

原文原文链接

以前，在 github 上开源了 ambari-Kylin 项目，可离线部署，支持 hdp 2.6+ 及 hdp 3.0+ 。github 地址为： https://github.com/841809077/... ，欢迎 star 。
这段时间，陆续有很多朋友经过公众号联系到我，问我相关的集成步骤。今天正好休息，索性将 ambari 自定义服务集成的原理给你们整理出来。html

它其实不难，可是网络上并无多少这方面的资料分享，官方也不多，因此学习门槛就稍微高了一些。但你若是能持续关注我，我相信您能快速上手。前端

1、简述 ambari

ambari 是一个可视化管理 Hadoop 生态系统的一个开源服务，像 hdfs、yarn、mapreduce、zookeeper、hive、hbase、spark、kafka 等均可以使用 ambari 界面来统一安装、部署、监控、告警等。python

mysql

对于未受 ambari 界面管理的服务，好比 Elasticsearch、Kylin、甚至是一个 jar 包，均可以利用自定义服务集成相关技术将服务集成到 ambari 界面里。这样，就能够经过 ambari 实现对自定义服务的安装、配置、启动、监听启动状态、中止、指标监控、告警、快速连接等不少操做，极其方便。git

2、宏观了解自定义服务集成原理

对于安装过 ambari 的朋友可能比较熟悉，咱们在部署 hdp 集群的时候，在界面上，会让咱们选择 hdp stack 的版本，好比有 2.0、... 、2.六、3.0、3.1 等，每个 stack 版本在 ambari 节点上都有对应的目录，里面存放着 hdp 各服务，像 hdfs、yarn、mapreduce、spark、hbase 这些，stack 版本高一些的，服务相对多一些。stack 版本目录具体在 ambari-server 节点的 /var/lib/ambari-server/resources/stacks/HDP 下，咱们用 python 开发的自定义服务脚本就会放到这个目录下。github

将自定义服务放到指定目录下，咱们须要重启 ambari server 才能在添加服务界面加载出来咱们的自定义服务，ambari 在安装自定义服务的过程当中，也会将 python 开发的自定义服务脚本分发到 agent 节点上，由 agent 节点的自定义服务脚本来执行安装、部署步骤。sql

等经过 ambari 安装自定义服务以后，ambari 会在数据库（好比 mysql）相关表里将自定义服务相关信息进行保存，和记录其它 hdp 服务同样的逻辑。数据库

3、微观了解自定义服务集成原理

一个自定义服务暂且将它定义为一个项目，项目名称须为大写，使用 python 编写。该项目框架有那么几个必不可少的文件或目录，分别是：json

metainfo.xml 文件：描述了对整个项目的约束配置，是一个核心文件。
configuration 目录：里面放置一个或多个 xml 文件，用于将该服务的配置信息展现在前端页面，也能够在ambari 页面上对服务的一些配置作更改，以下图所示：
package 目录：里面包含 scripts 文件夹，该目录下存放着 python 文件，用于对服务的安装、配置、启动、中止等操做。自定义服务 python 脚本依赖的模块是 resource_management 。该模块分布在不一样的目录下，但内容是一致的，以下图所示：

除了上述必不可少的目录或文件以外，还有一些文件能够丰富咱们自定义服务的功能。好比：segmentfault

alerts.json 文件：描述 ambari 对服务的告警设置。告警类型有 WEB、Port、Metric、Aggregate 和 Script ，以下图所示：
quicklinks.json 文件：用于生成快速连接，实现 url 的跳转。可支持多个 url 展现。
role_command_order.json 文件：决定各个服务组件之间的启动顺序，详情可参考：https://841809077.github.io/2...

以下图所示，这是自定义服务 KYLIN 的项目框架：

4、课程宣传

ambari 自定义服务集成的细节有不少，可是官方网站上并无太多的篇幅去介绍这一块知识，只能本身慢慢摸索。幸好有公司的支持和我的的努力，我已经将自定义服务的大部分知识点掌握，特绘制相关的知识脑图，具体以下：

后面我会利用业余时间将上述脑图中的 12 项录制成视频，节约你们学习成本。若是你们有这方面的需求，能够关注个人公众号，加我好友，一块儿讨论技术与人生。