Nacos一致性协议

发布时间 2023-10-20 18:35:29作者: 夏尔_717

一、概要

Nacos是阿里开放的一款中间件,它主要提供三种功能:持久化节点注册,非持久化节点注册和配置管理。

二、一致性协议 - AP/CP

Nacos不是纯粹的AP服务,也不是纯粹的CP服务,而是两者同时支持。

这要从服务注册说起,Provider启动时将自身的信息注册至注册中心,如果注册中心是Zookeeper,在注册时可以选择注册临时节点或者永久节点。如果注册中心是Eureka,服务注册只能注册临时节点。

Nacos同时借鉴了两者的模式,如果在Nacos上注册临时节点,那么Nacos就是AP服务,保证高可用。如果Nacos上注册永久节点,那么Nacos就是CP服务,保证数据一致性。

Nacos对这两者区分实现,通过Distro协议来实现AP,通过Raft来实现CP

2.1 Distro-AP

Distro协议的主要设计思想如下:

  • Nacos每个节点都可以处理写请求,同时把数据同步到其他节点
  • 每个节点只负责部分数据,定时发送自己负责数据的校验值到其他节点来保持数据一致性
  • 每个节点独立处理写请求,及时从本地发出响应

其实和Eureka差不多,多了每个节点独立负责一部分数据这个特性

数据初始化

当新节点加入时,它会轮询所有的Distro节点,只要一个节点正常响应就会拉取全量数据。

数据校验

Distro集群启动后,各台机器之间会定期发送心跳,心跳信息主要为各个机器上的所有数据的元信息,这种数据校验会以心跳的形式进行,即每台机器在固定的时间间隔会向其他机器发起一次数据校验请求,一旦在数据校验过程中,某台机器发现其他机器上的数据与本地数据不一致,则会发起一次全量拉取请求,将数据补齐。

写操作

当客户端写入注册非持久节点的请求时,Distro集群处理的流程图如下:

Distro会计算当前数据所属的节点,如果当前节点不是处理该数据的节点,那Distro会将其转发至责任节点,再由责任节点对其做请求解析,然后跟随定时Sync任务,将数据同步到其他Distro节点上。

2.2 Raft-CP

Nacos通过Raft来实现CP,详细可以看这:分布式一致性算法Raft

不过Nacos已经准备用JRaft来替换Raft了,相关的特性正在开发中,JRaft的详细可以看这里:JRaft RheaKV 用户指南

三、心跳检测

Nacos的心跳检测比较有特色。常规的心跳检测方式有两种,一种是客户端主动上报,服务端一段时间未收到心跳就会将客户端下线。另一种是服务端主动去调客户端的心跳接口,如果没有得到正常响应或者超时就将客户端下线。

在注册中心的场景中,客户端的数量一定是会远多于服务端的,如果让服务端去主动轮询心跳接口,会给服务端比较大的压力,所以目前的主流选择都是让客户端去主动上报。

但是Nacos对临时节点和永久节点分别做了处理,如果是临时节点,那么就需要临时节点主动上报,如果是永久节点,Nacos可以主动发起TCP端口检查或者是HTTP接口检查,用来做健康检查。

Nacos的定义中,临时节点都是弹性扩容之后注册的,随着访问量下来,相关服务是会被回收的,而有的永久节点是无法发起健康检查的,例如一些三方服务,只能提供出一个接口用于心跳检查。

四、配置中心原理

客户端启动后,每30秒给Server发送一个心跳包,Server拿到心跳包之后,先对比一下数据版本,如果版本一样说明数据没有变化,这时Server不会立即将该心跳返回,Server会一直拿着这个心跳,此时和客户端保持长连接的状态,直到数据有变化或者持有超过29.5秒,如果客户端感知到数据版本发生变化,就会主动请求Server拉取数据。

阿里出品的中间件都有个特点,不像一个纯粹的中间件,更像是业务锤炼出来的产物,在RocketMQNacos上这种味道特别明显,它总是会考虑非常多的业务场景,在性能与好用性方面做一个取舍,使用阿里中间件的最大感受就是:它也许不是性能最好的,也许不是纯粹的,但是一定是最适合拿来做业务的。