redis的主从复制、哨兵、集群-526互联

主从复制：

主从复制是高可用Redis的基础，哨兵和集群都是在主从复制基础上实现高可用的。主从复制主要实现了数据的多机备份，以及对于读操作的负载均衡和简单的故障恢复。缺陷：故障恢复无法自动化；写操作无法负载均衡；存储能力受到单机的限制。

作用：

数据冗余：主从复制实现了数据的热备份，是持久化之外的一种数据冗余方式。

故障恢复：当主节点出现问题时，可以由从节点提供服务，实现快速的故障恢复；实际上是一种服务的冗余。

负载均衡：在主从复制的基础上，配合读写分离，可以由主节点提供写服务，由从节点提供读服务（即写Redis数据时应用连接主节点，读Redis数据时应用连接从节点），分担服务器负载；尤其是在写少读多的场景下，通过多个从节点分担读负载，可以大大提高Redis服务器的并发量。

高可用基石：除了上述作用以外，主从复制还是哨兵和集群能够实施的基础，因此说主从复制是Redis高可用的基础。

原理：

（1）若启动一个Slave机器进程，则它会向Master机器发送一个“sync command”命令，请求同步连接。

（2）无论是第一次连接还是重新连接，Master机器都会启动一个后台进程，将数据快照保存到数据文件中（执行rdb操作），同时Master还会记录修改数据的所有命令并缓存在数据文件中。

（3）后台进程完成缓存操作之后，Master机器就会向Slave机器发送数据文件，Slave端机器将数据文件保存到硬盘上，然后将其加载到内存中，接着Master机器就会将修改数据的所有操作一并发送给Slave端机器。若Slave出现故障导致宕机，则恢复正常后会自动重新连接。

（4）Master机器收到Slave端机器的连接后，将其完整的数据文件发送给Slave端机器，如果Master同时收到多个Slave发来的同步请求，则Master会在后台启动一个进程以保存数据文件，然后将其发送给所有的Slave端机器，确保所有的Slave端机器都正常。

主从复制配置：(准备三台redis，实现一主两从架构)

主服务器（master节点）配置

修改 /redis.conf配置文件

#修改监听地址

#关闭访问保护

#检查端口号

#设置后台启动

#修改pid文件地址，添加日志文件地址

#修改持久化文件地址

#启用AOF持久化类型

重启主节点

主服务器（slave节点）配置

修改 /redis.conf配置文件

基本配置和主节点一致

唯一需要修改的是从服务器要指向同步的master节点的ip地址和端口号

配置重启从节点

验证主从效果：

在master节点上查看redis日志

在master节点上验证从节点：

在master节点上创建一个新键

在slave节点上查看是否同步

从节点可以查看到，说明主从复制配置成功。

哨兵：

主从切换技术的方法是：当服务器宕机后，需要手动一台从机切换为主机，这需要人工干预，不仅费时费力而且还会造成一段时间内服务不可用。为了解决主从复制的缺点，就有了哨兵机制。

哨兵的核心功能：在主从复制的基础上，哨兵引入了主节点的自动故障转移。

哨兵的作用

监控：哨兵会不断地检查主节点和从节点是否运作正常。

自动故障转移：当主节点不能正常工作时，哨兵会开始自动故障转移操作，它会将失效主节点的其中一个从节点升级为新的主节点，并让其它从节点改为复制新的主节点。

通知（提醒）：哨兵可以将故障转移的结果发送给客户端。

哨兵结构由两部分组成，哨兵节点和数据节点：

哨兵节点：哨兵系统由一个或多个哨兵节点组成，哨兵节点是特殊的redis节点，不存储数据。
数据节点：主节点和从节点都是数据节点。

哨兵故障转移的机制：

1.由哨兵节点定期监控发现主节点是否出现了故障每个哨兵节点每隔1秒会向主节点、从节点及其它哨兵节点发送一次ping命令做一次心跳检测。如果主节点在一定时间范围内不回复或者是回复一个错误消息，那么这个哨兵就会认为这个主节点主观下线了（单方面的）。当超过半数哨兵节点认为该主节点主观下线了，这样就客观下线了。

2.当主节点出现故障，此时哨兵节点会通过Raft算法（选举算法）实现选举机制共同选举出一个哨兵节点为leader，来负责处理主节点的故障转移和通知。所以整个运行哨兵的集群的数量不得少于3个节点。

3.由leader哨兵节点执行故障转移，过程如下：

将某一个从节点升级为新的主节点，让其它从节点指向新的主节点；
若原主节点恢复也变成从节点，并指向新的主节点；
通知客户端主节点已经更换。

需要特别注意的是，客观下线是主节点才有的概念；如果从节点和哨兵节点发生故障，被哨兵主观下线后，不会再有后续的客观下线和故障转移操作。

主节点的选举：

过滤掉不健康的（已下线的），没有回复哨兵 ping 响应的从节点。
选择配置文件中从节点优先级配置最高的。（replica-priority，默认值为100）
选择复制偏移量最大，也就是复制最完整的从节点。

搭建redis哨兵模式：

所有节点修改Redis 的sentinel配置文件

#关闭保护模式

#redis哨兵默认监听端口：26379

#指定sentinel为后台启动

#指定pid地址，指定日志文件存放路径

#指定数据库存放路径

#指定哨兵节点监控192.168.116.6:6379 这个主节点
#最后的2与主节点的故障判定有关；表示最少需要两个哨兵节点同意才能判定主节点故障并进行故障转移

#判定服务器down掉的时间周期，默认是30000毫秒

#同一个sentinel对同一个master两次failover之间的间隔时间180秒

#启动哨兵模式

#查看哨兵信息

#查看redis-server进程号

#将主节点的redis-server进程杀死

#再查看哨兵的信息，发现主节点地址切换到了从节点上，从节点成为新的master

集群：

通过集群，Redis解决了写操作无法负载均衡，以及存储能力受到单机限制的问题，实现了较为完善的高可用方案。

作用：

（1）数据分区：数据分区(或称数据分片)是集群最核心的功能。集群将数据分散到多个节点，一方面突破了Redis单机内存大小的限制，存储容量大大增加；另一方面每个主节点都可以对外提供读服务和写服务，大大提高了集群的响应能力。 Redis单机内存大小受限问题，在介绍持久化和主从复制时都有提及；例如，如果单机内存太大，bgsave和bgrewriteaof的fork操作可能导致主进程阻塞，主从环境下主机切换时可能导致从节点长时间无法提供服务，全量复制阶段主节点的复制缓冲区可能溢出。

（2）高可用：集群支持主从复制和主节点的自动故障转移（与哨兵类似）；当任一节点发生故障时，集群仍然可以对外提供服务。