prometheus几种高可用架构介绍及联邦架构部署

发布时间 2023-10-31 23:27:40作者: 呼长喜

**问题背景:**单个prometheus性能到达瓶颈问题、多个prometheus-server数据汇总问题等

**
prometheus监控数据持久化**

首先大家都知道prometheus是自带数据存储功能的。
优点是简单易用,基本无需配置
缺点是:1、存在数据无法长久保存(尤其是频繁变更的监控对象,监控对象变化,短时间内监控数据也会随之丢失,如k8s等)
2、基于本地存储的话,Prometheus监控系统扩展比较难
以上缺点可以配置远程存储解决,使用remote_write和remote_read这两个接口,从第三方存储服务中进行监控数据的读写

prometheus集群方案
这里有篇文章介绍了几种prometheus的集群架构,可参考:  https://zhuanlan.zhihu.com/p/86763004

**
方案一:**
多个prometheus监控相同的对象。意思就是一台node在被两台或两台以上的prometheus同时监控
缺点:对于被监控端,可能会多出一倍或以上的查询请求
优点:只要有一台prometheus还在运行,就不会影响监控

 

方案二:
联邦集群,prometheus数据层层往上汇聚(类似金字塔结构)
优点:数据汇总展示,prometheus-worker压力较小,如合理规划可以分类监控,数据保留更灵活(参考https://zhuanlan.zhihu.com/p/86763004)
缺点:prometheus-primary压力较大,可通过配置文件使不同的prometheus-primary收集不同类的监控数据(参考同上链接)
官网描述:  https://prometheus.io/docs/prometheus/latest/federation/