【故障公告】数据库服务器今年第七次 CPU 100% 故障

发布时间 2023-12-07 16:37:51作者: 博客园团队

自11月9日第六次数据库服务器 CPU 100% 故障之后,今天下午又出现数据库服务器 CPU 100% 故障,是今年的第七次。

今天的故障发生于 16:01~16:07 期间,发现故障后我们立即重启阿里云RDS实例,重启后恢复正常。

正准备发布这篇故障公告时,数据库服务器又出现 CPU 100%,我们立即改用主备切换,切换后恢复正常,故障时间是 16:20~16:25。

这次故障给大家带来了麻烦,请大家谅解。

我们使用的阿里云 RDS 实例规格是 SQL Server 2016 标准版-高可用系列-16核32G,这个 CPU 100% 问题很奇怪,可能是因为参数嗅探问题造成 SQL Server 缓存了性能极差的执行计划,我们会对照上次故障期间性能最差的 SQL 进一步排查。