读书笔记(SRE:Google运维解密):第10章 基于时间序列数据进行有效报警

服务可靠度层级模型 监控 (a)埋点 (b)指标收集:指标合成 (c)时间序列数据存储 (d)规则计算 (e)报警   汇总计算(aggregation),是分布式环境中不可缺少的一环。汇总计算过程可以将一个任务的所有实例中的某个time-series相加。通过计算总数,我们就可以计算整体速率(rate)。 例如:一个任务在整个数据中心中的整体每秒查询率(QPS)需要通过所有实例的查询计数器[14
相关文章
相关标签/搜索