安天防病毒,麒麟系统,内存溢出,问题排查

发布时间 2023-12-01 14:29:14作者: 叶子在行动

问题:

八角

 

今天客户遇到这个问题,导致系统的业务登录不进去,ssh也登录不上,用显示屏,发现一直报错

莱芜

 


解决步骤:

咱这两台跑的一样的应用吗?

我看刚才这台是nginx服务?

oom了

out of memory 了

命令:

收个sosreport -a ,打包下/var/log

sosreport -a 嗯

 

在17:30 左右没有效信息

不是kms激活的话,可以停掉这个激活服务

是因为kms这个问题导致的吗

不是,日志中发生问题的时间端没有记录 ,只是这个服务一直在刷,想关闭它

买的正版授权

 

这个是其他地方的截图

可能别的问题,out of memory 应该有日志记录的,咱这边在问题发生的时间段没有相关日志呢

需要怎么操作,能找找问题

先看下 rpm -qa | grep audit 和 rpm -qa| grep mate-indi

 

时间点是昨天的17:30左右是吗

昨天下午3点就有问题了

sar -r 5 -o /var/log/sarcpu.log

老师,您执行下这条命令,实时监控下内存,待再出现问题的时候,把那个log文件给我们发下看看

给个靠谱的解决方案,你这能叫找问题的方法吗

 

老师帮忙看下sysstat的版本;执行rpm -qa |grep sysstat

 

蕃茄你个西红柿: 老师,咱这个设备是内网环境还是外网环境?怎么会有el6的包呢?

zxg: 内网

蕃茄你个西红柿: 好的,那咱先更新下这个sysstat包吧,后续方便定位问题

zxg: el6是什么

蕃茄你个西红柿: rhel6版本的包

zxg: 有什么影响

蕃茄你个西红柿: 收集的系统资源数据,在我们系统上无法解码,el6的版本太低了

zxg: 装了防病毒

zxg: 你需要怎么看看

zxg: 现在还在报错,web页面和ssh等登录不上

zxg: 键盘没有反应

蕃茄你个西红柿: nginx服务里跑的应用把内存消耗了

蕃茄你个西红柿: 触发了oom

zxg: 能确定吗

zxg: 有没有什么能确定的日志,我让软件的厂家看看

蕃茄你个西红柿: 我们研发上午初步分析是这样的

zxg: 得有能确定的东西,我先找的软件的,他们看日志找不到问题,才找的你们

蕃茄你个西红柿: 

 

蕃茄你个西红柿: 您先把sysstat的el6包卸载了,装上我们ky10版本的

蕃茄你个西红柿: nginx的日志里一直在抛进程异常退出

 

zxg: 怎么操作

蕃茄你个西红柿: rpm -e sysstat

蕃茄你个西红柿: rpm -e sysstat-9.0.4-27加上版本号试试

zxg: 卸载了这个,后面就有日志了是吧

蕃茄你个西红柿: 再看看rpm -qa|grep sysstat

 

蕃茄你个西红柿: 在看下sar -V看看版本

蕃茄你个西红柿: 大写的V

 

蕃茄你个西红柿: 有网络源吗?

zxg: 没有

蕃茄你个西红柿: 这个是那个版本?nkvers

 

我给您找个安装包吧,稍等

蕃茄你个西红柿: 重装下这个包

zxg: 怎么装

蕃茄你个西红柿: rpm -ivh sysstat-12.2.1-6.ky10.x86_64.rpm

 

rpm -Uvh 呢

 


然后再看下sar -V

 


好了,可以了