Promethues 之 Thanos

时间 2021-01-16

标签 css html git github 面试 docker 数据库后端 api 缓存栏目 CSS 繁體版

原文原文链接

Promethues简介和原理

请看我以前写的 Prometheus简介,原理和安装
http://www.javashuo.com/article/p-yozmouno-bd.htmlcss

官方架构问题

官方架构存在一个最大的问题数据量一上去须要尽快拆分，例如在使用中发现Es的Export会拉取大量metrics直接致使单机Prom不堪重负「io巨高」固然指标太多也不是好事这个会在最后讨论下若是避免，因此须要拆分集群「此处不讨论官方的联邦策略，这个扩展性并无那么好，依然须要拆分多套联邦集群」html

顺着正常思路咱们必定是先拆分集群，我也没有逃出这个方法开始着手拆分，拆了历史数据还在老集群还要搬数据大量的Ops工做啊「哪怕写了自动化脚本，回车仍是要人敲的吧」，拆完了看着不错哦，可是另外的问题来了，要通知Dev咱们拆了地址变了，随之而来的是大量的通知「心很累」。metrics仍是不少总不能没事就拆吧，并且历史保留时间咱们是7天慢慢发现用户要查7天前的就再见了「没法支持」。git

固然咱们也有联邦集群，在联合部署中，全局Prometheus服务器能够在其余Prometheus服务器上聚合数据，这些服务区可能分布在多个数据中心。每台服务器只能看到一部分度量指标。为了处理每一个数据中心的负载，能够在一个数据中心内运行多台Prometheus服务器，并进行水平分片。在分片设置中，从服务器获取数据的子集，并由主服务器对其进行聚合。在查询特定的服务器时，须要查询拼凑数据的特定从服务器。默认状况下，Prometheus存储15天的时间序列数据。为了无限期存储数据，Prometheus提供了一个远程端点，用于将数据写入另外一个数据存储区。不过，在使用这种方法时，数据去重是个问题。其余解决方案（如Cortex）提供了一个远程写入端点和兼容的查询API，实现可伸缩的长期存储。github

综上问题主要是：拆分之痛、全局查询、数据去重、历史数据查询、AlertManager无高可用
**
业务发展快不是Ops推脱的理由，某天躺在床上刷刷微信发现神器尽然已经有了「虽然还只是一个测试版本」Thanos，果断开始调研发现能够啊基本解决了上面说起的多个痛点。「团队中也来两个了新的小伙伴 Go专职研发、监控系统小达人、感谢两位的帮助」心中无比激动，开始动手了。面试

Thanos是啥

Improbable团队开源了Thanos，一组经过跨集群联合、跨集群无限存储和全局查询为Prometheus增长高可用性的组件。Improbable部署了一个大型的Prometheus来监控他们的几十个Kubernetes集群。默认的Prometheus设置在查询历史数据、经过单个API调用进行跨分布式Prometheus服务器查询以及合并多个Prometheus数据方面存在困难。docker

Thanos经过使用后端的对象存储来解决数据保留问题。Prometheus在将数据写入磁盘时，边车的StoreAPI组件会检测到，并将数据上传到对象存储器中。Store组件还能够做为一个基于gossip协议的检索代理，让Querier组件与它进行通讯以获取数据。数据库

Thanos还提供了时间序列数据的压缩和降采样（downsample）存储。Prometheus提供了一个内置的压缩模型，现有较小的数据块被重写为较大的数据块，并进行结构重组以提升查询性能。Thanos在Compactor组件（做为批次做业运行）中使用了相同的机制，并压缩对象存储数据。Płotka说，Compactor也对数据进行降采样，“目前降采样时间间隔不可配置，不过咱们选择了一些合理的时间间隔——5分钟和1小时”。压缩也是其余时间序列数据库（如InfluxDB和OpenTSDB）的常见功能。后端

Thanos经过一种简单的可无缝接入当前系统的方案解决这些问题。其主要功能点经过Sidecar、Querier、Store和Compactor来实现，这里作一个简单介绍。api

+
Tenant's Premise | Provider Premise
                 |
                 |            +------------------------+
                 |            |                        |
                 |  +-------->+     Object Storage     |
                 |  |         |                        |
                 |  |         +-----------+------------+
                 |  |                     ^
                 |  | S3 API              | S3 API
                 |  |                     |
                 |  |         +-----------+------------+
                 |  |         |                        |       Store API
                 |  |         |  Thanos Store Gateway  +<-----------------------+
                 |  |         |                        |                        |
                 |  |         +------------------------+                        |
                 |  |                                                           |
                 |  +---------------------+                                     |
                 |                        |                                     |
+--------------+ |            +-----------+------------+              +---------+--------+
|              | | Remote     |                        |  Store API   |                  |
|  Prometheus  +------------->+     Thanos Receiver    +<-------------+  Thanos Querier  |
|              | | Write      |                        |              |                  |
+--------------+ |            +------------------------+              +---------+--------+
                 |                                                              ^
                 |                                                              |
+--------------+ |                                                              |
|              | |                PromQL                                        |
|    User      +----------------------------------------------------------------+
|              | |
+--------------+ |
                 +

把Prometheus的数据弄一份存到Min io, Prometheus里面默认保存24小时缓存

Sidecar

Sidecar做为一个单独的进程和已有的Prometheus实例运行在一个server上，互不影响。Sidecar能够视为一个Proxy组件，全部对Prometheus的访问都经过Sidecar来代理进行。经过Sidecar还能够将采集到的数据直接备份到云端对象存储服务器。「会消耗原有实例所在集群的资源，上线前能够先把原有server机器升配下」

Querier

全部的Sidecar与Querier直连，同时Querier实现了一套Prometheus官方的HTTP API从而保证对外提供与Prometheus一致的数据源接口，Grafana能够经过同一个查询接口请求不一样集群的数据，Querier负责找到对应的集群并经过Sidecar获取数据。Querier自己也是水平可扩展的，于是能够实现高可部署，并且Querier能够实现对高可部署的Prometheus的数据进行合并从而保证屡次查询结果的一致性，从而解决全局视图和高可用的问题。「配合云的AutoScaling」

Store

Store实现了一套和Sidecar彻底一致的API提供给Querier用于查询Sidecar备份到云端对象存储的数据。由于Sidecar在完成数据备份后，Prometheus会清理掉本地数据保证本地空间可用。因此当监控人员须要调取历史数据时只能去对象存储空间获取，而Store就提供了这样一个接口。Store Gateway只会缓存对象存储的基本信息，例如存储块的索引，从而保证明现快速查询的同时占用较少本地空间。

Comactor

Compactor主要用于对采集到的数据进行压缩，实现将数据存储至对象存储时节省空间。

Ruler

Ruler主要是管理多个AlertManager告警规则配置统一管理的问题「推荐使用集群版本的AlertManager，多个AlertManager以前放一个SLB便可」

Thanos优势

优势

对比官方的解决方案，这个东西能够支持跨集群查询、数据去重、历史数据查询、告警规则统一管理，固然还有别的你们本身脑补。

Thanos问题

store开始只能查询8次还不记得多少次就不行了，还有查询实例时间长了也不行了，须要注意「让研发哥哥解决了，如何解决的回头再放出来，最近官方新发布，貌似修改的这个问题，须要测试下。」使用的是Ceph「其实s3和oss也是能够的，只要支持s3协议便可」，ceph也有坑「这个我不懂了，有专人盯着的这边不讨论」，sidecar组件若是启动在原有就很忙的Prometheus边上以前须要谨慎「把原有OOM过一次」，建议仍是先拆了再搞。此组件已经引发官方关注，预祝早日合并到官方去。

容器外&容器内

大几率的不少同窗确定存在容器外面与容器内部两套环境、或者多容器环境。这边写下不成熟的小建议系统给到各位帮助，实现方法有两种「应该还有更多」，Thanos使用的是Gossip进行自动发现其实在容器内外发现上面仍是有点麻烦的。

**前提: **Thanos在容器里面MacVlan模式，Pod分配固定IP，漂移时保持IP不变。「容器网络不懂的，你们本身Google下」

SLB

经过k8s api定时判断thanos所在pod状况，若是发生变化调用云的api进行slb更新。「笨办法」

Cousul

万物揭注册原则，所有注册到cousul上面去「其实仍是要本身写一个小东西去完成注册」

指标过多

这个问题其实很纠结，Export吐那么多真的都能看的过来吗，目测不可能，须要在Pull那边作相应的控制，只看本身须要的其实对于Dev要求变高了。本身吐的么更是要精准，我是一个DBA吧不少时候面试都会问我你看那些指标啊，CPU、内存、IO、链接数还不够你看吗，指标不是越多越好谁没事都看一遍「闲得慌吗，存着不是浪费计算资源吗，DevOps的大环境下是否是Dev仍是须要一些基本看监控能力呢，不要变成只会打字的研发，不淘汰你淘汰谁呢……」

规范

依然要老生常谈规范这个事情，不要一上来就喊着要秒级监控「真的不必谁看啊」，定义到各个指标的命名规范其实比这套东西更为重要，让研发去理解其实很难的，你们都被业务压的喘不过气来，还有谁会去接受Ops的东西。

运维平台竟可能融合这套东西中最麻烦的几项好比，添加监控、添加告警尽量傻瓜式。定义到接口是Pull仍是Push，规范最重要，生产线能流畅的运转不是代码写的有多好「固然这个也很重要」，是各个接口之间的规范、文档、代码中的注释、要不换了人撸你代码、搞你系统的时候咋弄。意识习惯才是重要的，技术好坏是我的意识，习惯才是我的修养。