斌哥的 Docker 进阶指南—监控方案的实现

过去的一年中,关于 Docker 的话题从未断过,而现在,从尝试 Docker 到最终决定使用 Docker 的转化率依然在逐步升高,关于 Docker 的讨论更是有增无减。另外一方面,你们的注意力也渐渐从 “Docker 是什么”转移到“实践 Docker”与“监控 Docker”上。html

本文转自刘斌博文 「如何选择 Docker 监控方案 」 ,文中刘斌从技术的角度深刻解释了 Docker 监控的数据采集原理,介绍了现有开源的监控方案,以及可以对 Docker 进行监控功能的主流 SaaS 服务工具。node

上一篇文章中介绍了 Docker 监控目的及技术基础,本篇文章将介绍,Docker 监控方案的实现。ios

Docker 监控方案的实现git

  • 本身动手 + 开源软件
  • SaaS

评价标准github

  • 功能redis

    • 信息详细程度mongodb

    • 查询的灵活程度docker

    • 报警 + API数据库

  • 灵活性缓存

    • 定制
  • 成本

    • 学习、开发

    • 维护

  • 运维

    • 部署复杂程度
  • 高可用

须要考虑的基本要素如上所示,很少述。

本身动手

  • 灵活性强
  • 成本高

这里的成本包括开发成本,开发成本可能包括招人和培训,开发时间和填坑时间。开发完了还须要维护成本,并且随着Docker的升级,可能还须要对metric的采集实现进行升级,以及各类bugfix。

本身动手打造监控方案

  • 采集
  • 存储
  • 展现
  • 报警(动做)

StatsD 是 Flickr 公司首先提出来的,后来由 Esty 公司发扬光大的一个轻量级的指标采集模块。

简单来说,StatsD 就是一个简单的网络守护进程,基于 Node.js 平台(Esty实现,其实也有其余语言版本),经过 UDP 或者 TCP 方式侦听各类统计信息,包括计数器和定时器,能够用来采集操做系统、不一样数据库、中间件的数据指标,进行缓存、聚合,并发送到Graphite 等存储和可视化系统中。

StatsD 具备如下优势:

  • 简单

首先安装部署简单,且StatsD 协议是基于文本的,能够直接写入和读取,方便实现各类客户端和SDK。

Cloud Insight的探针也是采用这些方式,咱们有些SDK也是基于StatsD的,目前有RubyPythonJava的,在 GitHub 上能够看到。

  • 低耦合性

StatsD 守护进程采起 UDP 这种无状态的协议,收集指标和应用程序自己之间没有依赖,不会阻塞应用,无论StatsD的状态是运行中,仍是没在运行,都不会影响应用程序,应用程序也不关心StatsD是否收到数据。

  • 易集成

StatsD很是容易整合其余组件,能够本身编写采集业务逻辑,发送到StatsD守护进程便可。也就是说用户的工做很简单,只须要按定义好的规则采集数据发送到Stats,而后用Graphite存储、展现,经过使用Riemann进行报警。

Tcollector

  • 来源于OpenTSDB

Tcollector 是一个采集指标数据并保存到OpenTSDB的框架,你可使用该框架本身编写采集的业务逻辑。相似StatsD,运行在客户端,收集本地的metric信息,推送到OpenTSDB。

Collectd

  • System statistics collection daemon
  • 存储到RRD
  • 插件机制(input/output)
  • 简单报警功能

Collectd便是一个守护进程,也是一个框架,相似StatsD,它性能很是好,采用C语言编写。Collectd不直接支持从Docker中取数据,可是咱们能够本身编写插件来采集性能指标数据。

Collectd有强大的插件机制,已经实现了包括amqp、rrdtool、graphite、http、kafka、redis、mongodb、OpenTSDB以及CSV文件等在内的各类插件。

在4.3版本以后还支持简单的基于阈值检查的报警机制。

斌哥的 Docker 进阶指南—监控方案的实现

cAdvisor是一个用于收集、聚合处理和输出容器运行指标的守护进程。并且cAdvisor基本算是一个获取Docker性能数据的标配了吧。

斌哥的 Docker 进阶指南—监控方案的实现

一句命令就能够启动cAdvisor容器,访问8080端口便可看到性能指标数据。cAdvisor能够经过storage_driver参数将数据存到influxdb,同时也能够将metric输出为Prometheus的格式,因此不少自定义Docker监控系统都会采起cAdvisor + Prometheus 的组合。

存储TSDB

  • OpenTSDB
  • Influxdb
  • RRDTool
  • Graphite

关于时序列数据库,能够看附录中相关的介绍文章。推荐使用OpenTSDB或者Influxdb,简单对比一下各自特色以下:

  • OpenTSDB

    • Java & HBase
    • 易扩展(集群功能强大)
    • 机器多,运维稍显麻烦
  • Influxdb

    • Golang
    • 集群功能不太成熟
    • 有类SQL的查询语句
    • 单台便可工做

这二者都支持自由模式和多维度,很是适合用于采用tag机制的数据模式建模。 开源可视化工具

  • Graphite
  • Influxdb + Grafana
  • Prometheus

光有数据是不够的,raw data没有任何意义,咱们须要良好的可视化组件来展现数据和数据的内在乎义,发挥数据的做用。

咱们也能够将数据存储和展现交给其余开源软件。

若是你的数据采集和存储都是本身来完成的,只想使用一个外部的图形化界面的话,选Grafana应该没错,Grafana展示形式很是丰富,配置也很灵活。

斌哥的 Docker 进阶指南—监控方案的实现

以上,先到这里。

下一章,刘斌将为你们介绍 Docker 监控的开原方案,主流 SaaS 服务,及其特色。

超好用的监控软件 Cloud Insight 不只能监控 Docker,还能对 Nagios 进行更好的可视化哦~

阅读更多技术文章,请访问 OneAPM 官方博客

本文转自 OneAPM 官方博客

相关文章
相关标签/搜索