监控服务器所有磁盘的inode使用情况

发布时间 2023-11-05 08:32:43作者: 济南小老虎

监控服务器所有磁盘的inode使用情况


背景

因为前期数据库开启了审计
但是如果是 DB模式的话 $aud 表的冲突和使用太多了
所以专家建议将审计表放到OS
因为数据库的访问量特别高.
审计的信息又都是特别小的文件.
很容易造成 使用空间和足够, 但是inode已经不够的情况
OCP的碰哟告诉我这是常识, 我发现我对数据库的理解还是不充分
常识都不是非常清楚.  所以想趁着周末继续完善一下自己的知识体系
增加inode的监控. 

方式方法

采用 node_exporter+prometheus+grafana的方式进行. 

发现大部分的监控方式都是就用文件使用空间的
减少关注inode的 
然后想着跟监控内存cache的方法类似. 
也增加监控inode 的配置信息 

配置模板

导入:
8919

然后复制 磁盘使用空间的 的panel
注意复制完, 需要修改一下panel的名字方便管理. 

根据node_exporter的metrics 的信息
修改新复制的磁盘使用空间的几个值:

inode 总量:
node_filesystem_files{instance=~'$node',fstype=~"ext.*|xfs",mountpoint !~".*pod.*"}
inode 可用:
node_filesystem_files_free {instance=~'$node',fstype=~"ext.*|xfs",mountpoint !~".*pod.*"}-0

inode 的使用率
100 -node_filesystem_files_free{instance=~'$node',fstype=~"ext.*|xfs",mountpoint !~".*pod.*"}/node_filesystem_files{instance=~'$node',fstype=~"ext.*|xfs",mountpoint !~".*pod.*"} * 100

演示效果

image


其他处理

可以增加告警处理.
在发生较大变化时直接告警
建议阈值可以在 80% 左右.