Prometheus 集群方案之 Remote Read 实战

一直以来 Prometheus 被吐槽最多的就是 HA 和集群方案。 想想以前,我们用上顶配机器,但还会遇到磁盘,网络 IO,查询超时等问题,主要因为收集的数据量太大,超过单机承受的范围。 在过去一段时间,我们已经根据业务,部门,能拆分的都拆分到不同的 Prometheus 中去了,但即便如此,仍然存在一些问题: 有些业务无法拆分,数据量还是特别大。 数据收集和查询做的事情是完全独立的,但两者时常
相关文章
相关标签/搜索