IaaS--如何降低故障的影响(何恺铎《深入浅出云计算》笔记整理)

发布时间 2023-12-28 17:25:59作者: 1234roro

 

【常见故障及解决方法】

1、第一种故障是在宿主机的级别,这也是从概率上来说最常见的一种故障。宿主机出现问题,虚拟机肯定都会有问题。解决方法是,尽量做好集群,采用HA的方式,做好救场。集群也应该注意,虚拟机尽量放在不同虚拟机上,甚至对应的宿主机都最好避免在同一个机架上;

2、第二种规模更大的故障,是在数据中心,也就是可用区的层面。实例尽量放在不同的可用区,不同可用区做HA,不仅安全,还可以分担压力;

3、第三种更严重的故障,就是整个区域级别的事故了。最好的做法,就是DNS导流,通过域名解析,分散/转移到备用服务器。更保险的方法,就是购买多个云厂商的公有云,全网一起HA~

所以整体核心解决思路,就是HA。

【分流负担--弹性伸缩】

我们把多个虚拟机以弹性伸缩组的方式进行统一管理,能够极大地提高效率,减轻负担。因为弹性伸缩服务,会帮我们动态地创建和销毁虚拟机实例,自动根据我们指定的数量和扩缩容规则,来协调虚拟机的生命周期。我们只需要从高层进行指挥就可以了。这里很重要的一个概念,就是负载均衡。尝试使用弹性伸缩服务来实现云端弹性架构,用它来管理一组虚拟机,并与负载均衡一起配合。这特别适合处理无状态类的计算需求,因为它会为你代劳底层计算资源的管理。