基于Prometheus和Grafana的监控平台 - 环境搭建

相关概念

微服务中的监控分根据做用领域分为三大类,Logging,Tracing,Metrics。node

  • Logging - 用于记录离散的事件。例如,应用程序的调试信息或错误信息。它是咱们诊断问题的依据。好比咱们说的ELK就是基于Logging。linux

  • Metrics - 用于记录可聚合的数据。例如,队列的当前深度可被定义为一个度量值,在元素入队或出队时被更新;HTTP 请求个数可被定义为一个计数器,新请求到来时进行累。prometheus专一于Metrics领域。git

  • Tracing - 用于记录请求范围内的信息。例如,一次远程方法调用的执行过程和耗时。它是咱们排查系统性能问题的利器。最经常使用的有Skywalking,ping-point,zipkin。github

今天咱们主要聊聊Prometheus的监控,接下来咱们了解下须要涉及的几个关键组件。web

Prometheus

Prometheus(中文名:普罗米修斯)是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB). Prometheus使用Go语言开发, 是Google BorgMon监控系统的开源版本。sql

Prometheus的基本原理是经过HTTP协议周期性抓取被监控组件的状态, 任意组件只要提供对应的HTTP接口就能够接入监控. 不须要任何SDK或者其余的集成过程。输出被监控组件信息的HTTP接口被叫作exporter,目前开发经常使用的组件大部分都有exporter能够直接使用, 好比Nginx、MySQL、Linux系统信息、Mongo、ES等shell

exporter

prometheus能够理解为一个数据库+数据抓取工具, 工具从各处抓来统一的数据, 放入prometheus这一个时间序列数据库中. 那如何保证各处的数据格式是统一的呢?就是经过这个exporter. Exporter是一类数据采集组件的总称. Exporter负责从目标处搜集数据, 并将其转化为Prometheus支持的格式, 它开放了一个http接口(以便Prometheus来抓取数据). 与传统的数据采集组件不一样的是, Exporter并不向中央服务器发送数据, 而是等待中央服务器(如Prometheus等)主动前来抓取。https://github.com/prometheus 有不少写好的exporter,能够直接下载使用。数据库

Grafana

Grafana是一个图形化工具, 它能够从不少种数据源(例如Prometheus)中读取数据信息, 使用很漂亮的图表来展现数据, 而且有不少开源的dashborad可使用,能够快速地搭建起一个很是精美的监控平台。它与Prometheus的关系就相似于Kibana与ElasticSearch。浏览器

环境准备

在开始配置以前请下载如下几个软件(直接从github或者grafana官网下载太慢了,简直是龟速并且容易下载失败,建议使用迅雷下载)。服务器

安装

准备两台服务器,一台用做安装prometheus和grafana,一台用做放置exporter组件。创建应用文件夹,将相关软件上传至服务器。

  • 192.168.249.131 prometheus,grafana
  • 192.168.249.129 exporter

prometheus

使用以下shell命令进行安装并启动

tar zxvf prometheus-2.13.1.linux-amd64.tar.gz
mv prometheus-2.13.1.linux-amd64 prometheus
cd prometheus
nohup ./prometheus &

启动完成后,用浏览器打开http://192.168.249.131:9090进行访问,效果以下: file

grafana

使用以下shell命令进行安装并启动

tar grafana-6.4.3.linux-amd64.tar.gz
cd grafana-6.4.3
nohup ./grafana-server &

启动完成后,用浏览器打开http://192.168.249.131:3000进行访问,默认帐号密码为admin/admin,初次登录须要修改密码,修改密码并登录效果以下: file

node_exporter

使用以下shell命令进行安装并启动

tar zxvf node_exporter-0.18.1.linux-amd64.tar.gz
mv node_exporter-0.18.1.linux-amd64 node_exporter
nohup ./node_exporter &

node exporter默认使用9100端口,可使用--web.listen-address=":9200"指定端口号。
启动完成后,用浏览器打开http://192.168.249.129:9100/进行访问,显示效果以下: file

配置

prometheus

进入prometheus安装目录,修改prometheus.yml文件,增长监听job server-192.168.249.129,完整配置以下:

# my global config
global:
  scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
  evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
  # scrape_timeout is set to the global default (10s).

# Alertmanager configuration
alerting:
  alertmanagers:
  - static_configs:
    - targets:
      # - alertmanager:9093

rule_files:
  # - "first_rules.yml"
  # - "second_rules.yml"


scrape_configs:
  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  - job_name: 'prometheus'
    static_configs:
    - targets: ['localhost:9090']

  - job_name: '192.168.249.129'
    static_configs:
    - targets: ['192.168.249.129:9100']

配置完成后重启prometheus,查看监听状态。 file

grafana

  • 配置prometheus数据源 file

  • 官网寻找对应的表盘,咱们选择node exporter监控看板 file

  • 在grafana中在导入表盘 file file

  • 查看监控效果 file file

至此基于Prometheus的监控环境搭建完成,你也来动手试一下吧。

近期热文

欢迎关注个人我的公众号:JAVA日知录

相关文章
相关标签/搜索