kubernetes operator安装 的Prometheus,若是不会能够参考使用Operator部署Prometheusnode
前提:建立企业微信,建立应用web
而后配置altermanager.yamlapi
global:
resolve_timeout: 5m
receivers:
- name: wechat
wechat_configs:
- agent_id: "100000x"
api_secret: Nm7PRrxxxxG8EpkyWuXDAWMLmFo
corp_id: wwf9d3833cd2323ewdd
send_resolved: true
to_user: Joker
route:
group_by:
- job
group_interval: 5m
group_wait: 30s
receiver: wechat
repeat_interval: 12h
routes:
- match:
alertname: Watchdog
receiver: wechat
而后删除原有的alertmanager-main微信
kubectl delete secret alertmanager-main -n monitoring
从新建立运维
kubectl create secret generic alertmanager-main --from-file=alertmanager.yaml -n monitoring
而后就能够收到告警了
不过如今这个告警很差看,咱们能够自定义模板。
建立一个template.tmp1的文件。以下编辑器
{{ define "wechat.default.message" }}
{{- if gt (len .Alerts.Firing) 0 -}}
{{- range $index, $alert := .Alerts -}}
{{- if eq $index 0 }}
==========异常告警==========
告警类型: {{ $alert.Labels.alertname }}
告警级别: {{ $alert.Labels.severity }}
告警详情: {{ $alert.Annotations.message }}{{ $alert.Annotations.description}};{{$alert.Annotations.summary}}
故障时间: {{ ($alert.StartsAt.Add 28800e9).Format "2006-01-02 15:04:05" }}
{{- if gt (len $alert.Labels.instance) 0 }}
实例信息: {{ $alert.Labels.instance }}
{{- end }}
{{- if gt (len $alert.Labels.namespace) 0 }}
命名空间: {{ $alert.Labels.namespace }}
{{- end }}
{{- if gt (len $alert.Labels.node) 0 }}
节点信息: {{ $alert.Labels.node }}
{{- end }}
{{- if gt (len $alert.Labels.pod) 0 }}
实例名称: {{ $alert.Labels.pod }}
{{- end }}
============END============
{{- end }}
{{- end }}
{{- end }}
{{- if gt (len .Alerts.Resolved) 0 -}}
{{- range $index, $alert := .Alerts -}}
{{- if eq $index 0 }}
==========异常恢复==========
告警类型: {{ $alert.Labels.alertname }}
告警级别: {{ $alert.Labels.severity }}
告警详情: {{ $alert.Annotations.message }}{{ $alert.Annotations.description}};{{$alert.Annotations.summary}}
故障时间: {{ ($alert.StartsAt.Add 28800e9).Format "2006-01-02 15:04:05" }}
恢复时间: {{ ($alert.EndsAt.Add 28800e9).Format "2006-01-02 15:04:05" }}
{{- if gt (len $alert.Labels.instance) 0 }}
实例信息: {{ $alert.Labels.instance }}
{{- end }}
{{- if gt (len $alert.Labels.namespace) 0 }}
命名空间: {{ $alert.Labels.namespace }}
{{- end }}
{{- if gt (len $alert.Labels.node) 0 }}
节点信息: {{ $alert.Labels.node }}
{{- end }}
{{- if gt (len $alert.Labels.pod) 0 }}
实例名称: {{ $alert.Labels.pod }}
{{- end }}
============END============
{{- end }}
{{- end }}
{{- end }}
{{- end }}
而后将其和上面的altermanager.yaml放到同一个secret中。
先修改altermanager.yaml,以下:url
global:
resolve_timeout: 5m
receivers:
- name: wechat
wechat_configs:
- agent_id: "100000x"
api_secret: Nm7PRrxxxxG8EpkyWuXDAWMLmFo
corp_id: wwf9d3833cd66f34d8
send_resolved: true
to_user: Joker
route:
group_by:
- job
group_interval: 5m
group_wait: 30s
receiver: wechat
repeat_interval: 12h
routes:
- match:
alertname: Watchdog
receiver: wechat
templates:
- /etc/alertmanager/config/template.tmp1
以下先删除,再建立spa
kubectl delete secret alertmanager-main -n monitoring
kubectl create secret generic alertmanager-main --from-file=alertmanager.yaml --from-file=template.tmp1 -n monitoring
而后报警出来就会好看些了。.net
完3d
-----------------------
公众号:乔边故事(ID:qiaobiangushi)
知乎: 乔边故事
博客:极客运维
永远不要高估本身,作一个谦逊又自信的人。
-----------------------
扫码二维码关注公众号,不按期维护优质内容,技术干货!
舒适提示
若是你喜欢本文,请分享到朋友圈,想要得到更多信息,请关注我。
本文分享自微信公众号 - 极客运维圈(qiaobiangushi)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。