在上一篇中,我们简单介绍了Redis三种模式中的两种模式,即主从模式、Sentinel模式,并对这两种模式的优缺点进行了总结:
模式 | 主从 | Sentinel |
---|---|---|
优点 | 1、安全可靠 2、主从分离,读写分离 | 1、高可用 2、数据量不限 |
缺点 | 1、如果某一个节点挂掉,需要人工介入,尤其是当master节点挂掉之后,整个集群不能写 2、不支持大数据量的操作 3、不支持扩容 | 1、不支持动态扩容 |
从上述可以看出,虽然Sentinel模式在一定程度上解决了主从模式所存在的问题,但是二者有一个共同的缺点,就是不支持动态扩容,为了解决这个问题,Redis引入了第三种模式,即Cluster模式。
Cluster模式的特点:
1、client直连,没有代理
2、去中心化,两两交互,每个节点都有其他节点的想详细信息
3、内部传输采用自有的gossip协议,减小数据传输量
一个稳定的Cluster集群必须有6个节点,即三主三从,之所以是6个,是因为里面涉及到了投票选举。如果此时只有两个节点,即A 和 B,A说B下线,B说A下线,这样永远都不会有定论,如果有三个节点的话,即A B和C。A和B均发现C不通,那么得到一致结论:C已经下线。
Cluster中的每个节点都维护一份在自己看来当前整个集群的状态,主要包括:
1、当前集群状态
2、集群中各节点所负责的slots信息,及其migrate状态
3、集群中各节点的master-slave状态
4、集群中各节点的存活状态及不可达投票
基于Gossip协议当集群状态变化时,如新节点加入、slot迁移、节点宕机、slave提升为新Master,我们希望这些变化尽快的被发现,传播到整个集群的所有节点并达成一致。节点之间相互的心跳(PING,PONG,MEET)及其携带的数据是集群状态传播最主要的途径。
Gossip 协议(gossip protocol)又称 epidemic 协议(epidemic protocol),是基于流行病传播方式的节点或者进程之间信息交换的协议。在分布式系统中被广泛使用,比如我们可以使用 gossip 协议来确保网络中所有节点的数据一样。gossip protocol 最初是由施乐公司帕洛阿尔托研究中心(Palo Alto Research Center)的研究员艾伦·德默斯(Alan Demers)于1987年创造的。
Gossip协议已经是P2P网络中比较成熟的协议了。Gossip协议的最大的好处是,即使集群节点的数量增加,每个节点的负载也不会增加很多,几乎是恒定的。这就允许Consul管理的集群规模能横向扩展到数千个节点。
Gossip算法又被称为反熵(Anti-Entropy),熵是物理学上的一个概念,代表杂乱无章,而反熵就是在杂乱无章中寻求一致,这充分说明了Gossip的特点:在一个有界网络中,每个节点都随机地与其他节点通信,经过一番杂乱无章的通信,最终所有节点的状态都会达成一致。每个节点可能知道所有其他节点,也可能仅知道几个邻居节点,只要这些节可以通过网络连通,最终他们的状态都是一致的,当然这也是疫情传播的特点。
1、Meet 通过「cluster meet ip port」命令,已有集群的节点会向新的节点发送邀请,加入现有集群。
2、Ping 节点每秒会向集群中其他节点发送 ping 消息,消息中带有自己已知的两个节点的地址、槽、状态信息、最后一次通信时间等。
在Cluster中,有如下类型的协议字段:
CLUSTERMSG_TYPE_PING:gossip协议的ping消息。
CLUSTERMSG_TYPE_PONG:gossip协议的pong消息。
CLUSTERMSG_TYPE_MEET:握手消息。
CLUSTERMSG_TYPE_FAIL:master节点检测到,超过半数master认为某master离线,则发送fail消息。
CLUSTERMSG_TYPE_PUBLISH:publish消息,向其他节点推送消息。
CLUSTERMSG_TYPE_FAILOVER_AUTH_REQUEST:故障转移时,slave发送向其他master投票请求。
CLUSTERMSG_TYPE_FAILOVER_AUTH_ACK:故障转移时,其他master回应slave的请求。
CLUSTERMSG_TYPE_UPDATE:通知某节点,它负责的某些slot被另一个节点替换。
CLUSTERMSG_TYPE_MFSTART:手动故障转移时,slave请求master停止访问,从而对比两者的数据偏移量,可以达到一致。
从数据存储的角度来看,cluster如下图所示,即每一次操作key的时候,都先对key通过CRC16(key) & 16383,这样得到slots的位置,然后通过slots来获取该slots所在的node的ip和端口,从而进行key操作。
扩容
准备工作:
1、准备新节点
2、加入集群
3、迁移槽和数据
在cluster中,首先通过add-node 将node加入集群中,然后通过cluster meet命令通知集群中的其他机器,是的新节点与老节点互相交换集群信息。这一步可以通过redis cluster提供的工具来实现,即:
redis-trib.rb add-node127.0.0.1:7006127.0.0.1:7007
通过add操作后,我们通过cluster nodes 能够看到新增加的节点信息。
下面,我们着重讲下迁移槽和数据
上图是通过命令操作,将slot 7448 给新的节点
在数据迁移过程中,访问数据可能会有两个状态:
1、ASKING(代表该key正在迁移)
节点可能会返回ASK错误。这种错误是在key对应的slot正在进行数据迁移时产生的,这时候向slot的原节点访问,如果key在迁移源节点上,则该次命令能直接执行。如果key不在迁移源节点上,则会返回ASK错误,描述信息会附上迁移目的节点的地址。客户端这时候要先向迁移目的节点发送ASKING命令,然后执行之前的命令。
2、MOVED(代表该key已经被迁移)
*客户端在初始化的时候只需要知道一个节点的地址即可,客户端会先尝试向这个节点执行命令,比如“get key”,如果key所在的slot刚好在该节点上,则能够直接执行成功。如果slot不在该节点,则节点会返回MOVED错误,同时把该slot对应的节点告诉客户端。客户端可以去该节点执行命令。目前客户端有两种做法获取数据分布表,一种就是客户端每次根据返回的MOVED信息缓存一个slot对应的节点,但是这种做法在初期会经常造成访问两次集群。还有一种做法是在节点返回MOVED信息后,通过cluster nodes命令获取整个数据分布表,这样就*能每次请求到正确的节点,一旦数据分布表发生变化,请求到错误的节点,返回MOVED信息后,重新执行cluster nodes命令更新数据分布表。
在自动恢复方面,当某个master失败时候,集群中的其他节点可以通过选举策略,重新从该master的slave中选取一个,成为一个新的master,并重新在集群内部广播,当老的master恢复后,会成为新的master的slave节点,如下图所示:
下图中,集群处于falied状态,不可用(有其他方式,可以继续使用其他可用的slot,但是这样是不安全的,不建议这么做)
Cluster failed需要满足以下两个条件:
1、至少有一个slot不可用
2、集群中大部分master处于PFAILED状态
1、节点探测超时时间内没有响应,则会标记为PFAIL状态,类似于sentinel的sdown
2、集群节点交换互相认识,超过一半master认为其为PFAIL,
则改为FAIL,类似于sentinel中的odown
集群恢复:
1、slave节点收到fail消息,竞选master
2、竞选方式与sentinel选主类似,都使用raft协议
3、从其他master拉取选票,选票最多的slave被提升为master
4、新master给集群内其他节点发送PONG消息,告知自己角色提升
5、其他slave开始从新master复制数据
5、旧master恢复后,成为新master的slave
Cluster中,slave节点,只是用来备份数据以及在master故障的时候,其用来成为master即实现高可用功能的,在默认情况下,读和写都是在master上面,可以通过向slave发送READONLY命令,来支持在slave上进行数据读取。
综上,虽然Cluster实现了高可用和可扩容的功能,但是其使用上还是很复杂的,尤其对于client的实现来说,需要保存server端slot和ip的对应关系,下面我们总结下其特点:
优点:
1、高性能,避免proxy代理的消耗
2、高可用,自动故障转移
3、自带迁移功能
4、丰富的集群管理命令
缺点或者不足:
1、Client实现复杂,需要实现slot 映射
2、迁移异常不能自修复
3、节点太多时候,节点检测占用带宽
4、不支持不同slot的批量命令(MEGT、MSET等)
5、只支持db0,即只支持select0
Copyright© 2013-2020
All Rights Reserved 京ICP备2023019179号-8