013.Redis Cluster架构原理
1. Redis单master的瓶颈
- master节点的数据和slave节点的数据是一模一样的,master节点的最多能容纳多少数据量,slave节点也就只能容纳这么多数据
- 当数据量超过master的内存,redis会使用LRU算法清除部分数据
- 如果确实要容纳更多的数据量,redis主从架构是无法解决这个问题的
2. Redis Cluster架构原理
2.1 Redis Cluster架构概述
Redis Cluster是Redis的分布式解决方案,在3.0版本正式推出,解决单master架构的内存、并发、流量等瓶颈,以达到负载均衡的目的。
- 每个master负责整个集群的一部分数据,每个节点负责数据多少可能不一样
- 每个master的角色是对等的
- 每个master节点都可以有N个slave节点,当一个master节点挂掉后,它的其中一个slave节点升级为master
- redis cluster已经自动具备了主从复制能力,也就是说,我们不需要手动再去搭建主从+sentinel架构
- redis cluster适用于海量数据、高并发、高可用场景
2.2 Hash Slot算法
(1) 分布式存储的数据分配算法
-
按照顺序存储
- 与业务相关,例如商品信息存在A节点,用户信息存在B节点,每个节点的数据可以排序
- 容易造成数据倾斜
- 代表产品:HBase
-
散列存储
-
离散度好,数据均匀分布,每个节点的数据量大致相同
-
业务无关
-
无法顺序访问
-
代表产品:Redis Cluster
-
分布式存储的hash算法演进
(2) hash算法
-
优点
- 简单
-
问题
- 一旦某个master宕机,就需要调整hash算法,所有的数据都需要重新计算取模(由对3取模变成对2取模),然后重新分配数据
- 发生这种故障时,在数据未重新分配之前,由于更换了hash算法,导致大部分的请求都无法正确的拿到数据,从而不得不去访问数据库,在高并发场景下,这样是不能接受的,所以目前分布式缓存不再使用此种算法分配数据
-
适用场景
常用于数据库的分库分表规则,采用预分区的方式,提前根据数据量规划好分区数,保证可支撑未来一段时间的数据量
-
扩容方案
通常采用翻倍扩容,避免数据映射全部被打乱导致全量迁移
(3) 一致性hash算法
- 实现思路
- 每个节点被预先分配一个token(可以理解为它管理的hash值的边界),多个节点管理范围为[0, 2^32]的hash值范围
- 数据读写时,先根据key求hash值,然后就知道此hash值在哪段范围内
- 顺时针找到的节点就是其数据存储的节点
- 问题
- 加减节点会造成哈希环中部分数据(1/N的数据量,N为节点个数)无法命中,当一个master挂掉之后,例如master1挂掉,那么当请求从master1获取数据时,是获取不到的,于是继续顺时针去master2、master0获取数据,当然也是获取不到的,需要手动处理这些无法命中的数据
- 节点数量越多,增减节点带来的影响越小,因此不适用与集群中只有少量节点的情况
- 容易造成数据热点问题
- 扩容方案
- master的增减,需要增加一倍或者减少一倍,才能保证数据和负载的均衡
(4) 优化后的一致性hash算法
- 给master节点之间增加了均匀分布的虚拟节点
- 如果某个区间内有大量的数据,顺时针找到的就是其他的虚拟节点,这样每个区间内的数据都会均匀的分配到不同的master中去
(5) redis的hash slot算法
-
实现原理
-
Redis Cluster使用16384个槽(slot)来管理一段整数集合(hash值),slot是集群内数据管理和迁移的基本单位
-
每个master节点负责管理一部分slot,例如有5个节点,那个每个节点管理大约3276个槽
-
对每个key使用CRC32算法进行hash得到一个整数值,然后使用hash值对16384进行取模,得到此数据应该分配到的slot编号,配置该slot即可被该slot的master管理
-
每个master管理的slot的信息就缓存在本地,客户端连接集群时,会获取集群slot配置信息,从而通过key精确找到slot所在的节点
-
可以强制指定某个key挂在指定的slot上
-
-
优点
-
解耦数据和节点之间的关系,简化了节点扩容和收缩难度,增加一个master,就让其他的master分一部分slot给新来的master管理,移除一个master,就把这个master管理的slot分配给其他的master
-
某个master挂掉,不影响整个集群,因为请求是到slot,而不是到master,但在slot迁移完成之前,请求到挂掉的节点也是不行的
-
slot迁移的过程是很快的
-
节点自身维护slot的映射关系,无需人为管理
-
支持槽、节点、key之间的映射关系查询
-