Prometheus监控k8s集群节点主机内存/CPU使用率

发布时间 2024-01-12 12:00:16作者: 呼长喜

CPU使用率:

(1 - avg(rate(node_cpu_seconds_total{mode="idle"}[5m])) by (instance)) *100

说明:

container_cpu_usage_seconds_total 该容器服务针对每个CPU累计消耗的CPU时间。如果有多个CPU,则总的CPU时间需要把各个CPU耗费的时间相加,可以求出平均1s容器使用的时间
machine_cpu_cores cadvisor的当前节点CPU数目

内存使用率:

表达式1:(1 - (node_memory_MemAvailable_bytes{} / (node_memory_MemTotal_bytes{})))* 100

表达式2:(node_memory_MemTotal_bytes - node_memory_MemAvailable_bytes) / node_memory_MemTotal_bytes * 100

说明:

container_memory_working_set_bytes 容器使用内存 更能体现出mem usage,也是oom killer指标

machine_memory_bytes 当前主机内存大小