SRE

SRE中的SLA/SLO/SLI

SLA通俗理解 SLA 表征服务方与客户间的服务等级协议,定义服务方需保证的服务质量以及不达标情况下的服务补偿,在SRE领域,SLA 细分为 SLI、SLO 与 SLA: SLI,服务质量指标,服务的某项质量的一个具体的量化指标,如时延、吞吐量、错误率等。 SLO,服务质量目标,服务的某项 SLI  ......
SRE SLA SLO SLI

Uber SRE 实践:运维大型分布式系统的一些心得

本文是 Uber 的工程师 Gergely Orosz 的文章,原文地址在:https://blog.pragmaticengineer.com/operating-a-high-scale-distributed-system/ 在过去的几年里,我一直在构建和运营一个大型分布式系统:优步的支付系统 ......
分布式 心得 系统 Uber SRE

Google SRE 定义了四个需要监控 延迟(Latency),流量(Traffic),错误(Errors)和饱和度(Saturation)

Google SRE 定义了四个需要监控的关键指标。延迟(Latency),流量(Traffic),错误(Errors)和饱和度(Saturation)。 正如google sre 所讨论的,如果您只能衡量服务的四个指标,请关注这四个指标。 延迟 Latency 延迟是服务处理传入请求和发送响应所用 ......
饱和度 Saturation 流量 错误 Latency

运维(SRE)核心技能之稳定性六道防线

稳定性系统建设 稳定性定义和衡量 型定性的系统性分析 六道防线 相关讨论 2021年十大故障 引起故障的因素 如何衡量稳定性的好坏 六道防线 三个通用场景 三个具体场景 稳定性模板 资源、安全、稳定、成本关系(上) 资源、安全、稳定、成本关系(下) ......
防线 稳定性 技能 核心 SRE

SRE(运维工程师)成长路线

第一个运维工程师 一天,玛丽的儿子劳伦在摆弄 MIT 。当她在键盘上乱按的时候,一条错误信息突然出现。劳伦不知怎地启动了一个叫做 PO1 的预运行程序,原本正在飞行状态的模拟器一下子崩溃了。 虽然一般来说宇航员不会犯这样的错,但玛格丽特还是想加一段代码防止这种状况的发生。这一提议被 NASA 否决, ......
路线 工程师 工程 SRE

DevOps和SRE工程师必需知道的检查清单

DevOps Roadmap | DevOps工程师技能成长路线图: 对于布道者来说,DevOps 是一种文化和转型。对于一些工程师来说,DevOps 是一套敏捷的工具和技术的集合。对于经理来说,DevOps 可能是一种方法论。对于其他人来说,这只是一个时髦术语;对于招聘者来说,DevOps 是一份 ......
清单 工程师 DevOps 工程 SRE

国外的SRE都是干啥工作的?薪资如何?

本文翻译自:https://www.flagship.io/glossary/site-reliability-engineer/,意译~ 众所周知,开发和 IT 运营之间因为屁股决定脑袋,存在巨大的鸿沟,而网站可靠性工程师(SRE)在开发和 IT 运营之间建立了一座桥梁,SRE 会承担原本属于 I ......
薪资 SRE
共37篇  :2/2页 首页上一页2下一页尾页