Raid卡型号的简单辨认与问题发现过程

发布时间 2023-12-18 15:41:56作者: 济南小老虎

Raid卡型号的简单辨认与问题发现过程


背景

同事给了一个awr报告. 
!-_-! 其实我看不懂.
但是他告诉我 有大量的log file sync 的等待事件.
然后又给了一套其他的文件,
发现logfile 的sync 时间都是秒级. 
很多时候都到了 六七秒
我感觉出现了非常严重的性能问题. 
怀疑是存储有问题. 这里简单总结一下过程...

报告信息

最前面有如下信息: 
Note: All timings are in milliseconds (1000 milliseconds = 1 second)

然后发现非常多的时间这样, 需要注意我删减了部分报告信息. 
18-DEC-23 01.45.18.235 PM    1        885 JDBC Thin Client                              log file sync                     2991.048
buffer#: 46208                           sync scn: 2132555670                     : 0

18-DEC-23 01.45.18.235 PM    1        890 JDBC Thin Client                              log file sync                     2924.455
18-DEC-23 01.45.18.235 PM    1        892 JDBC Thin Client                              log file sync                     5918.017           
18-DEC-23 01.45.18.235 PM    1        949 JDBC Thin Client                              log file sync                     1462.007
18-DEC-23 01.45.18.235 PM    1        951 JDBC Thin Client                              log file sync                     3989.733
18-DEC-23 01.45.18.235 PM    1       1012 JDBC Thin Client                              log file sync                     5788.511
18-DEC-23 01.45.18.235 PM    1       1073 JDBC Thin Client                              log file sync                     7009.870
18-DEC-23 01.45.18.235 PM    1       1074 JDBC Thin Client                              log file sync                     6782.789

初步判断

磁盘性能很差.
同事告知用dd的结果很不错.

但是记得 dd 只是单线程写入测试, 无法模拟 oracle这种并发写入的程序
还是怀疑磁盘比较差. 

判断方法

通过: dmidecode -t 1 
查看机器序列号.
然后上厂商官网去查系统的出场配置信息:
https://support.ieisystem.com/eportal/ui?struts.portlet.action=/portlet/download-front!toView.action&pageId=2367231&index=0&product_id=6621&type=4&productName=NF8480M6

输入序列号, 发现磁盘非常好, 不符合自己的判断预期. 

但是同事告知机器有改配. 然后这种服务器 四路的底子,肯定有raid卡, 所以准备先从raid卡着手去查. 

确认Raid卡型号

dmesg -T |grep -i raid
后者是
cat /proc/scsi/scsi

两种方式获取raid卡的型号. 

这次获取出来的RAID卡型号是 PM8222

发现坑

注意, 我这边经常用过很多: PM8204-2GB 的RAID卡
但是从来没用过 PM82222 的卡. 

之前遇到过机器IO特别垃圾的情况, 发现是这个PM8222的raid卡

跟厂商售后聊过.
这个raid卡 没有缓存, 没有电池, 一个是白板的raid卡, 非常垃圾. 

如果backend 是 HDD的话 几乎是垃圾中的战斗机. 

当时改善写入性能唯一的方法是: 开启HDD上面少的可怜的 Cache..

但是如果用的不是PMR还是SMR的HDD磁盘的话. 

只能自求多福, 当个应用服务器我都嫌弃他加载jar包和css/js文件卡顿.
如果用来当数据库 !-_-!  还是放弃吧..