我爱编程

分布式架构生成全局唯一有序ID方案

2018-04-03  本文已影响0人  憨人Zoe

今天看了一篇如题所示的相关文章 干货 | 分布式架构系统生成全局唯一序列号的一个思路,很有收获,特来简书分享,加深印象。

通常我们不推荐使用自增主键作为程序的业务字段使用,所以只要保证单表有序且唯一就可以满足大多数场景了。但是如果未来涉及到数据库迁移和分库分表的逻辑变更,那么使用全局唯一且有序的id会给我们减少许多不必要的麻烦。

就唯一性来说,uuid是一个不错的选择,但是uuid本身毫无意义,也无序。

就有序来说,mysql的自增也只是对单库单表有效。

大多数人可能会想到用redis,既满足高并发场景,其原子性操作又能保证唯一。

比如我们搭建一个redis集群,有5台机器。将每个redis节点的初始值分别设置为1,2,3,4,5,step步长不小于redis节点数,假设为5,获取id时使用redis的incr进行累加,便可得到如下表:

redis节点 id
A 1,6,11,16,21...
B 2,7,12,17,22...
C 3,8,13,18,23...
D 4,9,14,19,24...
E 5,10,15,20,25...

所示的有序且唯一id。

使用redis生成全局唯一有序id方式的详细讲解和优缺点可以参见顶部原文。

文章中主要讲解的是基于flicker优化改进的方案。具体实现是,单表递增,内存缓存号段的方式。

首先我们新建一张表unique_id_tab,结构如下:

字段名 类型 描述
id int 主键,自增
host varchar 唯一索引,保存服务器ip

这里记录ip是为了服务器隔离。假设有5台服务器:192.168.1.1,192.168.1.2,192.168.1.3,192.168.1.4,192.168.1.5

首先,在mysql中执行:

REPLACE INTO unique_id_tab(host) VALUES('192.168.1.n')

得到 192.168.1.n 对应的主键 p;

REPLACE INTO 的用法是首先匹配要插入的值是否存在,如果存在则删除已存在的那条记录,插入新记录,如不存在,直接插入。但要插入的值必须包含主键或唯一索引。

得到主键 p后,将p乘以1000,得到p*1000,以此数作为该批id区间的起始id,(p+1)*1000作为此区间的结束id,并记录在程序内存中。

第一次初始化后,理论上表unique_id_tab的数据为(ip顺序不一定):

id host
1 192.168.1.1
2 192.168.1.2
3 192.168.1.3
4 192.168.1.4
5 192.168.1.5

对应的该批次的id区间应该是(注意闭合条件):

id id区间
192.168.1.1 [1000,2000)
192.168.1.2 [2000-3000)
192.168.1.3 [3000-4000)
192.168.1.4 [4000-5000)
192.168.1.5 [5000-6000)

每次请求进来,先去内存中取id,如果id小于区间最大id,直接返回使用,如果id等于最大id,则需要再次申请新的id区间。假设192.168.1.1这台机器的id分配完了,此时执行:

REPLACE INTO unique_id_tab(host) VALUES('192.168.1.1')

表unique_id_tab的数据变为:

id host
2 192.168.1.2
3 192.168.1.3
4 192.168.1.4
5 192.168.1.5
6 192.168.1.1

于是新的id区间为 [6000,7000)。同理,其他机器也用此种方式申请新的id区间。

更多详细讲解请参见原文

上一篇下一篇

猜你喜欢

热点阅读