grafana----alert

Alert只有grafana V4.0以上。

Introduction(介绍)

Grafana中的alert容许在dashboard panels你附加一些规则。当你保存仪表板Grafana将提取的报警规则到一个单独的报警规则库和安排评审它们。sql

在"graph”面板的“Alert”选项卡中,您能够配置应该评估警报规则的频率以及警报须要更改状态并触发通知的条件。数据库

Execution

警报规则在Grafana后端的一个调度程序和查询执行引擎中被评估,这是Grafana核心的一部分。如今只支持一些数据源。他们包括Graphite, Prometheus, InfluxDB and OpenTSDB。后端

Clustering

当前警报支持配置高可用性。从v4.2.0开始,当运行多个服务器时,警报通知会快速去除重复的。这意味着全部的警告在每一个服务器上执行,但没有重复的警告通知发送(deduping logic)。将来将引入适当的警报负载平衡。服务器

Rule Config

目前只有graph面板支持报警规则但这将被添加到singlestat和表板以及在将来的版本。函数

 

Name & Evaluation interval

在这里,您能够指定警报规则的名称,以及调度器应该多长时间对警报规则进行评估。测试

Conditions

目前惟一存在的条件类型是一个查询条件,容许您指定查询字母(metric里查询语句的字母,表明哪一个查询语句)、时间范围和聚合函数。this

Query condition example

例:avg() OF query(A, 5m, now) IS BELOW 14:
 从如今开始,往前的5分钟Metric那条sql查出来数据的平均值 小于14
  • avg() :控制如何将每一个serie 值下降到一个能够与阈值比较的值。 点击该功能能够选择另外一个聚合函数。
  • query(A, 5m, now) :字母A表明从Metrics页签查询A查询条件语句。第二个参数定义了时间范围, 5m, now 意思从如今到如今的5分钟。这是有用的,若是你想忽略最后2分钟的数据。
  • IS BELOW 14:定义的阈值和阈值的类型。你能够点击IS BELOW 改变阈值的类型

警报规则中使用的查询不能包含任何模板变量。目前,咱们只支持条件之间的AND\OR操做。
例如,咱们有如下3个条件:条件:A(计算为true)或条件:B(计算为false)和条件:C(计算为:true),因此结果将被计算为((真或假)和true)= true。lua

咱们计划在未来添加其余的条件类型,像其余警报同样,您能够在您的条件和时间中包含另外一个警报的状态。spa

Multiple Series

若是一个查询返回多个series,那么将对每一个series进行聚合函数和阈值检查。Grafana目前没有作的是每系列的跟踪警报规则。这一点在下面的场景中有详细的含义。调试

  • 报警条件查询,返回2系列:Server1和Server2
  • server1系列致使警报规则消防开关状态Alerting
  • 通知发送消息:load peaking (server1)
  • 在一个相同的报警规则Server2序列的子序列评价也引发火灾预警规则
  • 因为警报规则已经处于状态Alerting,因此没有发出新通知。

因此你能够看到从上面的场景,当其余系列引发警戒火灾若是规则已经在状态报警,Grafana不会发出通知时,。为了改进对返回多个系列的查询的支持,咱们计划在未来的版本中跟踪每一个序列的状态。

No Data / Null values

下面的条件,你能够配置返回没有数据或空数据,规则评估引擎应该如何处理查询。

No Data Option:If no data or all values are nul

NoData:设置警报规则状态为空

Alerting:将警报规则状态设置为报警

 keep Last state:保持当前的警报规则状态。

Execution errors or timeouts

下面的选项,若是处理超时错误:If execution error or timeout

Alerting:将警报规则状态设置为报警

 keep Last state:保持当前的警报规则状态。

若是一个不可靠的 time series存储,当查询超时或随机失败时,您能够设置这个选项Keep Last State基本上忽略它们。

 

Notifications

在警告选项卡中,还能够指定警报规则通知,以及关于警报规则的详细信息。这个消息能够包含任何信息,关于如何解决这个问题的信息,连接到runbook等。

实际的通知被配置并在多个警报之间共享。阅读 notifications指南,了解如何配置和设置通知。

Alert State History & Annotations

警惕状态的变化都被记录在内部注释Grafana的数据库表。状态更改可视为警报规则的图形面板中的注释。你也能够去alert的子State history中查看和clear history(清除历史状态)。

Troubleshooting

 

您能够作的第一级故障排除是点击Test Rule按钮。您将获得结果,您能够扩展到能够看到从查询返回的原始数据的点。

进一步的诊断也能够经过检查grafana服务器日志。若是不是错误,或者因为某种缘由,日志什么也不说,您能够为某些相关组件启用调试日志记录。这是在Grafana的INI配置文件了。

 

Alert List Panel

这个新面板容许您显示警报规则或警报规则状态更改的历史记录。您能够根据您感兴趣的状态进行筛选。这个面板式仪表盘是很是有用的概述。

   show

    current state:当前的状态。

    recent state changes:最近的状态。

  Max items:显示警告数目

  Alerts form this dashboard:选择只显示当前dashboard的警告;不选择显示全部dashboard的警告。

state filter:显示状态变动的类型,不选择,所有显示。 

 

 

Alert Notifications

当警报改变状态时,它发出通知。每一个警报规则能够有多个通知。但为了添加通知警报规则首先须要添加和配置通知渠道(能够是电子邮件,Pagerduty或其余集成)。这是从通知通道页面完成的。

Notification Channel Setup

在Notification Channels上,单击New Channel按钮,转到能够配置和设置新通知通道的页面。
指定name和type,以及指定特定选项。您还能够测试通知以确保它正确地工做和安装。

Send on all alerts

选中后,该选项将使该通知用于全部警报规则,现有的和新的。

Supported Notification Types

Grafana有下列通知类型:

Email

启用电子邮件通知你在grafana配置设置SMTP设置。电子邮件通知会将警报图像的图像上传到外部图像目的地,若是可用的话,或者在电子邮件中附加图像的后退。

相关文章
相关标签/搜索
本站公众号
   欢迎关注本站公众号,获取更多信息