[运维笔记]内网服务器或设备宕机了怎么及时收到通知并处理

发布时间 2023-10-27 18:33:22作者: 幸

前言

此前公司内网的一台服务器运行着六七个各种各样的后台任务,还跑着几个客户端。之后有一天晚上,公司里断电了,服务器也就停了,因为不是关键业务,所以之后几天谁也没发现,直到一周后才发现服务器没在处理。

那怎么在服务器宕机时及时知道呢

目前的简单办法:

无非在服务器上跑个定时任务,发个请求到某些第三方服务上,请求到达,说明服务器正在运行;
如果很长一段时间,请求没有发送过来,说明服务器估计就宕机了,立刻发个通知到企业微信群或钉钉群里。
这样管理员就可以及时的去处理问题。

怎么做,具体步骤:

注意:操作系统 Linux,这里我们以熊猫监控(xmtui.com)提供的服务为例子

创建 cron 任务:

  1. 使用 SSH 连接到服务器/计算机

  2. 输入 crontab -e

  3. 选一个你常用的编辑器

  4. 添加如下条目(每隔5分钟发送一次请求):

    */5 * * * * wget --spider "https://jiankong.xmtui.com/push/oooooooo-xxxxxxxxxxxxxxx" >/dev/null 2>&1
    将这里的 URL 替换为你自己的 心跳包监控项的 URL,并将该/5部分替换为相应的间隔值。

    你也可以curl的方式:

    */5 * * * * curl --insecure https://jiankong.xmtui.com/push/oooooooo-xxxxxxxxxxxxxxx >/dev/null 2>&1

  5. 保存并关闭文件(无需重新启动)

这样熊猫监控(xmtui.com)在没有收到请求时,就可以及时的向我们管理员发送通知。