SRE-基于阿里云的告警体系建设

发布时间 2023-11-06 15:49:09作者: IntoTw

基于数据源来做分类

sls日志告警

配置以及查看方式

sls日志左侧点击铃铛进入告警中心配置

告警规则触发就是sls日志的查询语句,配置的规则时间内,查询语句查询的数量达到配置值,就会触发告警

现状

5XX告警

应用error日志告警

云产品监控告警

配置以及查看方式

阿里云直接搜索云监控

左边云产品监控,然后搜索要配置的云产品即可,比如redis,rds,kafka

进去搜索到对应的实例,点击报警规则进去配置

现状

redis命中率,cpu等监控

mysql内存等监控

kafka堆积等监控

arms监控告警

配置以及查看方式

arms-应用监控-应用监控告警规则

现状

pod的fullgc,内存,以及应用的接口环比,慢接口等指标

xxl-job告警

配置以及查看方式

xxl-job管理台配置任务时选择告警组即可

现状