事故

生产事故-记一次特殊的OOM排查

0x01 事故背景 2023年3月10日14时19分,C公司开发人员向A公司开发人员反映某开放接口从2023年3月10日14时许开始无法访问和使用。该系统为某基础数据接口服务,基于 HTTP 协议进行通信。按照惯例,首先排查网络是否异常,经运维人员检查,证明网络连通性没有问题。A公司开发组于2023 ......
事故 OOM

生产事故-记一次特殊的OOM排查

事故背景 2023年3月10日14时19分,C公司开发人员向A公司开发人员反映某开放接口从2023年3月10日14时许开始无法访问和使用。该系统为某基础数据接口服务,基于 HTTP 协议进行通信。按照惯例,首先排查网络是否异常,经运维人员检查,证明网络连通性没有问题。A公司开发组于2023年3月10 ......
事故 OOM

生产事故-记一次特殊的OOM排查

入职多年,面对生产环境,尽管都是小心翼翼,慎之又慎,还是难免捅出篓子。轻则满头大汗,面红耳赤。重则系统停摆,损失资金。每一个生产事故的背后,都是宝贵的经验和教训,都是项目成员的血泪史。为了更好地防范和遏制今后的各类事故,特开此专题,长期更新和记录大大小小的各类事故。有些是亲身经历,有些是经人耳传口授 ......
事故 OOM

多线程现场事故解决案例

1.最近做一个项目,需要有分配授权数量,但初始化必须是0 2.授权的数量在使用中必须一个个扣除 3.每次消耗都要进行记录,然后再扣减数量 看起来上面三部都没问题, 问题就在第三步呀,消耗记录报错后,数量没有来得及扣除,这样相当与白送了一键给对方,为什么呢 ,因为你是用了就要扣除,我管你报不报错,不够 ......
线程 事故 案例

一次因生产事故与chatGpt的对话

一次因生产事故与chatGpt的对话 前言:生产出现了一个内存溢出的事故,记录错误信息。错误日志如下 org.springframework.web.util.NestedServletException: Handler dispatch failed; nested exception is j ......
事故 chatGpt

【事故】记一次意外把企业项目放到GitHub并被fork,如何使用DMCA下架政策保障隐私

前言 🍊缘由 在一个月黑风高的夜晚,正准备休息的我突然接到之前外包老总的亲切问候。一顿输出才知道三年前为了搭建流程化部署,将甲方的测试代码放到github上后忘记删除。现在被甲方的代码扫描机制扫到,并且检查到代码已经被其他用户fork,虽没有造成损失,但要求清除github所有数据及被fork的代 ......
事故 隐私 政策 项目 GitHub

TCP 三次握手八股文,完美解决线上事故

大家好,我是小富~ 个人资源分享网站:FIRE 本文收录在 Springboot-Notebook 面试锦集 前言 之前有个小伙伴在技术交流群里咨询过一个问题,我当时还给提供了点排查思路,是个典型的八股文转实战分析的案例,我觉得挺有意思,趁着中午休息简单整理出来和大家分享下,有不严谨的地方欢迎大家指 ......
八股文 八股 事故 TCP

使用prometheus来避免Kubernetes CPU Limits造成的事故

使用prometheus来避免Kubernetes CPU Limits造成的事故 译自:Using Prometheus to Avoid Disasters with Kubernetes CPU Limits 本文将介绍Kubernetes的resource limits是如何工作的、使用哪些 ......
prometheus Kubernetes 事故 Limits CPU

生产事故-错误密钥引发的接口通信问题

入职多年,面对生产环境,尽管都是小心翼翼,慎之又慎,还是难免捅出篓子。轻则满头大汗,面红耳赤。重则系统停摆,损失资金。每一个生产事故的背后,都是宝贵的经验和教训,都是项目成员的血泪史。为了更好地防范和遏制今后的各类事故,特开此专题,长期更新和记录大大小小的各类事故。有些是亲身经历,有些是经人耳传口授 ......
密钥 事故 接口 错误 问题
共39篇  :2/2页 首页上一页2下一页尾页