事故

记一次因更改MySQL的表名称引起的外键引用错误引发的事故处理

场景: MySQL更改原表名sys_org_element为sys_org_element_bak1导致了所有引用sys_org_element的表的id做外键的表全部引用了sys_org_element_bak1表,进而引发因外键导致的数据插入不了的问题。 解决办法: 一开始想到的是手动更改外键呗 ......
事故处理 事故 错误 名称 MySQL

记一次严重的线上宕机事故

1.时间 2023.12.17日夜间 2.现象 数据库后台大量死锁,死锁数量不断增加,磁盘空间不足 表中数据无法delete,无法truncate,无法drop掉。 3.处理 重启了数据库实例 4.故障和解决方式 服务器下个别数据库未还原成功,异地备份后还原成功 教训:终生难忘!!! 严格遵守规范, ......
事故

mq引发的线上事故【nested exception is org.springframework.amqp.AmqpIOException】

背景: 前一天晚上运维关闭了服务间公网访问,第二天早晨系统登录不进去了,重启进去也报错 原因: mq连接不上,大量mq请求拖垮了系统;开发人员犯了两个错误(1. 内部通信用了公网地址访问, 2.mq发送请求没有做异步处理) ERROR -Servlet.service() for servlet [ ......

网络IO 实战篇 :电商系统:重大事故!IO问题引发线上几十台机器同时崩溃

几年前的一个下午,公司里码农们正在安静地敲着代码,突然很多人的手机同时“哔哔”地响了起来。本来以为发工资了,都挺高兴!打开一看,原来是告警短信 故障回顾 告警提示“线程数过多,超出阈值”,“CPU空闲率太低”。打开监控系统一看,订单服务所有20个服务节点都不行了,服务没响应。 每个springboo ......
实战 事故 同时 机器 问题

【转】阿里云的严重事故,钉钉、闲鱼、淘宝、语雀等都崩了.....让我们全方位复盘一下

许多小伙伴应该都听说过,前两天在IT行业爆出了一个大瓜。是什么事情呢?在11月12日17:50-21:15。, 三个半小时的时间里,不但阿里云、钉钉、闲鱼、淘宝、语雀......甚至连某些高校的饮水机都崩了! 故障现象 阿里的内部服务都是部署在阿里云上,所以阿里系的各个产品都出现了崩溃问题,一度冲上 ......
全方位 事故

语雀10.23事故分析

## 语雀10.23事故分析 语雀公告:https://mp.weixin.qq.com/s/WFLLU8R4bmiqv6OGa-QMcw 事故原因: ![image-20231025125109671](https://img2023.cnblogs.com/blog/540671/202310/ ......
事故 10.23 10 23

记录--P0事故预警

这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 背景 某一天,前端小余同学和后端别问我小哥在做登录业务接口对接,出于业务的特殊性和安全性的考虑,她和后端小哥约定“user”相关信息参数需要通过HTTP协议的header传递过来,利用HTTPS协议的头部中的参数可以通过加密传输,从而保证 ......
事故 P0

烟花爆竹厂如何做到0风险0爆炸事故?AI+视频监控平台给出答案

由于烟花爆竹具有易燃易爆风险,稍有不慎就会发生严重事故,而烟花爆竹厂区作为大量烟花爆竹存放地点,厂区面积大、工作人员杂乱,甚至有很多厂区原料存放不当,给日常的安全管理带来极大的压力,利用信息化手段结合传统视频监管就可大力提升烟花爆竹厂区的安全监管效率。 方案实现 1、 远程监控 通过在烟花鞭炮厂内部 ......
爆竹厂 视频监控 爆竹 烟花 事故

烟花爆竹厂如何做到0风险0爆炸事故?AI+视频监控平台给出答案

在厂区周围与各个出入口设定禁止闯入区域,一旦有人进入禁区,就立即发出告警进行驱赶警示,还会自动保存闯入者画面,为后期溯源留存证据。 ......
爆竹厂 视频监控 爆竹 烟花 事故

8月Node服务的3场事故

有句话叫每一起严重事故的背后,必然有 29 次轻微事故和 300 起未遂先兆以及 1000 起事故隐患。 而我最近更是碰到了 3 起比较严重的线上事故,都是大意惹的祸。 一、数据库锁死 第一起事故发生在凌晨 4 点到 6 点,我们有个数据库被锁死了,无法更新和写入。 当天早上 5 点客服打电话给我, ......
事故 Node

R语言非线性回归和广义线性模型:泊松回归、伽马回归、逻辑回归、Beta回归分析机动车事故、小鼠感染、蛤蜊数据、补剂锻炼钠摄入数据

全文链接:https://tecdat.cn/?p=33781 原文出处:拓端数据部落公众号 我们使用广义线性模型(Generalized Linear Models,简称GLM)来研究客户的非正态数据,并探索非线性关系。GLM是一种灵活的统计模型,适用于各种数据类型和分布,包括二项分布、泊松分布和 ......
补剂 数据 蛤蜊 小鼠 非线性

KubeSphere Namespace 数据删除事故分析与解决全记录

> 作者:宇轩辞白,运维研发工程师,目前专注于云原生、Kubernetes、容器、Linux、运维自动化等领域。 ## 前言 2023 年 7 月 23 日在项目上线前夕,K8s 生产环境出现故障,经过紧急修复之后,K8s 环境恢复正常;另外我们环境引入了 KubeSphere 云原生平台技术,为了 ......
KubeSphere Namespace 事故 数据

井下空气质量检测预警系统,煤矿生产、事故应急检测和实时监测(三河凡科科技飞讯教学篇)

井下空气质量检测预警系统,煤矿生产、事故应急检测和实时监测(三河凡科科技飞讯教学篇) 在煤矿生产中,空气质量是关系到矿工生命安全的重要因素。煤矿内部存在着各种有害气体,如甲烷、一氧化碳等,高浓度的有害气体会导致矿工中毒、窒息等危险情况,因此煤矿空气质量的检测和监测是非常重要的工作。 为了保障煤矿工人 ......
质量检测 煤矿 事故 空气 质量

一次分页慢查询导致的事故处理过程 转载

原文:https://juejin.cn/post/7126356005192990750 事故背景 这次事故也是我们组里遇到的一次关于分页慢查询的典型例子,通过这篇文章,你可以很清晰的跟随我们还原事故现场,以及每一步遇到问题做出的调整和改动。 事故问题现场 16:00 收到同事反馈,融合系统分⻚查 ......
事故处理 事故 过程

一行 log 日志,引发 P1 级线上事故!

作者:老鹰汤 \ 链接:https://juejin.cn/post/7156439842958606349 ## 线上事故回顾 前段时间新增一个特别简单的功能,晚上上线前`review`代码时想到公司拼搏进取的价值观临时加一行log日志,觉得就一行简单的日志基本上没啥问题,结果刚上完线后一堆报警, ......
一行 事故 日志 log P1

马尔可夫转换模型研究交通伤亡人数事故时间序列预测|附代码数据

原文链接:http://tecdat.cn/?p=12227 最近我们被客户要求撰写关于马尔可夫转换模型的研究报告,包括一些图形和统计输出。 本文描述了R语言中马尔克夫转换模型的分析过程 首先,对模拟数据集进行详细建模。接下来,将马尔可夫转换模型拟合到具有离散响应变量的真实数据集。用于验证对这些数据 ......
时间序列 序列 模型 事故 人数

【现网事故】记一次多系统调用,并发冲突、请求放大导致的生产问题

在本文中,记录一次并发冲突与请求放大导致的生产环境事故。分析导致这个问题的原因,分享这个过程中的一些实践和经验教训。 ......
事故 问题 系统

8 个线程池最佳实践和坑!使用不当直接生产事故!!

这篇文章我会简单总结一下我了解的使用线程池的时候应该注意的坑以及一些优秀的实践。拿来即用,美滋滋! 内容概览: Java指南:https://java-family.cn 1、正确声明线程池 线程池必须手动通过 ThreadPoolExecutor 的构造函数来声明,避免使用Executors 类创 ......
线程 事故

正泰电力携手图扑:VR 变电站事故追忆反演

为高度响应时代数字化进程,正泰电力公司与图扑软件携手共建“ VR 变电站事故追忆反演数字孪生系统”。整体采用现代化的 VR 技术与设备,参考现实业务场景,通过数据实时采集和变电站数据建模等方式,诠释变电站虚拟仿真业务的三维场景。 ......
变电站 事故 电力

15、威胁与事故管理

## 一、漏洞管理 技术漏洞康(简称为漏洞管理)是一种安全事件,专门用于主动缓解或防止系统或组织中存在的**技术漏洞**(technical vulnerability)的利用问题。该过程涉及系统中各种你该漏洞的识别、分类、修复和缓解。技术漏洞管理是网络安全的一个重要组成部分,与风险管理以及其他安全 ......
事故

记一次etcd全局锁使用不当导致的事故

### 1、背景介绍 前两天,现场的同事使用开发的程序测试时,发现日志中报`etcdserver: mvcc: database space exceeded`,导致 etcd 无法连接。很奇怪,我们开发的程序只用到了 etcd 做程序的主备,并没有往 etcd 中写入大量的数据,为什么会造成 et ......
全局 事故 etcd

R语言ggmap空间可视化机动车交通事故地图|附代码数据

原文链接:http://tecdat.cn/?p=12350 最近我们被客户要求撰写关于空间可视化的研究报告,包括一些图形和统计输出。 在本文中,我使用ggmap可视化纽约市的交通事故 数据来自纽约市开放数据。我的数据范围是2012年至2015年。该数据跟踪车辆的类型,发生事故的街道的名称以及事故的 ......
交通事故 机动车 机动 事故 语言

曲江煤矿事故给我们带来的教训及解决方案的介绍

安科瑞虞佳豪 曲​江煤矿今年3月11日曾发生全矿停电事故,停电超过3小时,瓦斯超限报警持续41分钟,掘进工作面瓦斯浓度最高达到16.23%,造成138人涉险,该矿仍不吸取教训,开展矿山安全生产综合整治不细致、风险隐患排查治理走过场,5月5日发生电氧焊切割枪体爆炸事故,5月8日发生矿工坠落煤仓事故。 ......
煤矿 教训 事故 解决方案 方案

备份与容灾 - 记录一次小事故

## 记录一次事故 打 Release 包时,发现工程文件夹被删除,无法打 Release 包,需要从头开始打,需要6个小时 导致了几个问题: 1. 时间问题 2. 增量更新变成了全量更新,只能打全量包了 ### 教训: 1. **容灾** 没有备份重要数据,只备份打包好的程序和文件夹也是不行的,需 ......
备份 事故

韶关木材加工厂火灾事故及工厂加强防火的措施

安科瑞虞佳豪 12月15日凌晨4时许,韶关市曲江区大塘镇一木材加工厂发生火灾,现场火势猛烈,无人员被困。经过近3小时的紧急救援明火成功熄灭。目前起火原因正进一步调查中。 ​木材属于可燃物质,燃点低,一般在250℃~300℃,有的木材用明火点燃时,较低着火点为157℃,自燃点一般在350℃左右。在木材 ......
火灾 木材 加工厂 事故 工厂

和儿子讨论交通事故

上周的一个早晨,开车出事故了,周几我忘记了。 事故起因 开车送儿子上学,因为孩子要中考,晚上睡得晚,所以早晨就给他多睡一会,哪怕是几分钟,所以我要压缩开车送他去学校的时间。 车刚上路那会送他去学校,一般7点中前出发,到学校都是在15分钟左右。 因为今年是初三,所以我开始不断提升我的驾驶技术,正常在1 ......
交通事故 事故 儿子 交通

.NET EFCode内存溢出事故一次记录

以下代码导致内存溢出: 是一段连表查询导致查询不到的问题 var onelst = await dbpTasks.Where(Epr).Join(Context.DbpTaskMetadata.AsNoTracking().GroupBy(meta => meta.Taskid).Select(g ......
事故 内存 EFCode NET

4 03 | 看透本质:研发出了生产事故,到底要不要罚钱?

你好,我是乔新亮。“本质”这个词现在已经烂大街了,我看很多的公众号文章,动不动就说本质、底层原理,这也侧面说明我们每个人面对复杂问题时的心态:我们想直击问题的关键点,找到问题背后的本质。 但,你我也都知道,看透本质终归是一件很难的事。昨天我就还遇到一件让我自己头疼的事情,思考很久之后,还是没有找到好 ......
本质 要不 事故 03

生产事故-走近科学之消失的JWT

入职多年,面对生产环境,尽管都是小心翼翼,慎之又慎,还是难免捅出篓子。轻则满头大汗,面红耳赤。重则系统停摆,损失资金。每一个生产事故的背后,都是宝贵的经验和教训,都是项目成员的血泪史。为了更好地防范和遏制今后的各类事故,特开此专题,长期更新和记录大大小小的各类事故。有些是亲身经历,有些是经人耳传口授 ......
事故 科学 JWT

生产事故-记一次特殊的OOM排查

生产事故-记一次特殊的OOM排查 入职多年,面对生产环境,尽管都是小心翼翼,慎之又慎,还是难免捅出篓子。轻则满头大汗,面红耳赤。重则系统停摆,损失资金。每一个生产事故的背后,都是宝贵的经验和教训,都是项目成员的血泪史。为了更好地防范和遏制今后的各类事故,特开此专题,长期更新和记录大大小小的各类事故。 ......
事故 OOM
共39篇  :1/2页 首页上一页1下一页尾页