分布式业务系统中,全局ID生成策略
一、全局ID简介
在实际的开发中,几乎所有的业务场景产生的数据,都需要一个唯一ID作为核心标识,用来流程化管理。比如常见的:
订单:order-id,查订单详情,物流状态等;
支付:pay-id,支付状态,基于ID事务管理;
如何生成唯一标识,在普通场景下,一般的方法就可以解决,例如:
importjava.util.UUID;
publicclassUuidUtil{
publicstaticStringgetUUid(){
UUID uuid = UUID.randomUUID();
returnString.valueOf(uuid).replace("-","");
}
}
这个方法可以解决绝大部分唯一ID需求的场景业务,但是网上各种UUID重复场景的描述帖,说的好像该API不好用。
絮叨一句:说一个真实使用的业务场景,大概是半年近3000万的数据流水,用的就是UUID的API,暂时未捕捉到ID重复的问题,仅供参考。
二、雪花算法
1、概念简介
Twitter公司开源的分布式ID生成算法策略,生成的ID遵循时间的顺序。
1为位标识,始终为0,不可用;
41位时间截,存储时间截的差值(当前时间截-开始时间截);
10位的机器标识,10位的长度最多支持部署1024个节点;
12位序列,毫秒内的计数,12位的计数顺序号支持每个节点每毫秒产生4096个ID序号;
SnowFlake的优点是,整体上按照时间自增排序,并且整个分布式系统内不会产生ID碰撞(由数据中心ID和机器ID作区分),并且效率较高。
2、编码实现
工具类中很多可以自定义的,比如起始时间,机器ID配置等。
/**
* 雪花算法ID生成
*/
publicclassSnowIdWorkerUtil{
// 开始时间截 (2020-01-02)
privatefinallongtimeToCut =1577894400000L;
// 机器ID所占的位数
privatefinallongworkerIdBits =2L;
// 数据标识ID所占的位数
privatefinallongdataCenterIdBits =8L;
// 支持的最大机器ID,结果是31 (这个移位算法可以很快的计算出几位二进制数所能表示的最大十进制数)
privatefinallongmaxWorkerId = -1L^ (-1L<< workerIdBits);
// 支持的最大数据标识ID,结果是31
privatefinallongmaxDataCenterId = -1L^ (-1L<< dataCenterIdBits);
// 序列在ID中占的位数
privatefinallongsequenceBits =12L;
// 机器ID向左移12位
privatefinallongworkerIdShift = sequenceBits;
// 数据标识ID向左移17位(12+5)
privatefinallongdataCenterIdShift = sequenceBits + workerIdBits;
// 时间截向左移22位(5+5+12)
privatefinallongtimestampLeftShift = sequenceBits + workerIdBits + dataCenterIdBits;
// 生成序列的掩码
privatefinallongsequenceMask = -1L^ (-1L<< sequenceBits);
// 工作机器ID(0~31)
privatelongworkerId;
// 数据中心ID(0~31)
privatelongdataCenterId;
// 毫秒内序列(0~4095)
privatelongsequence =0L;
// 上次生成ID的时间截
privatelonglastTimestamp = -1L;
/**
* 构造函数
*@paramworkerId 工作ID (0~31)
*@paramdataCenterId 数据中心ID (0~31)
*/
publicSnowIdWorkerUtil(longworkerId,longdataCenterId){
if(workerId > maxWorkerId || workerId <0) {
thrownewIllegalArgumentException("workerId 不符合条件");
}
if(dataCenterId > maxDataCenterId || dataCenterId <0) {
thrownewIllegalArgumentException("dataCenterId 不符合条件");
}
this.workerId = workerId;
this.dataCenterId = dataCenterId;
}
publicsynchronizedStringnextIdVar(){
returnString.valueOf(nextId());
}
/**
* 线程安全,获得下一个ID
*/
privatesynchronizedlongnextId(){
longtimestamp = timeGen();
// 如果当前时间小于上一次ID生成的时间戳,抛出异常
if(timestamp < lastTimestamp) {
thrownewRuntimeException(String.format(
"时间顺序异常,时间差(上次时间-现在)=%d",
lastTimestamp - timestamp));
}
// 如果是同一时间生成的,则进行毫秒内序列
if(lastTimestamp == timestamp) {
sequence = (sequence +1) & sequenceMask;
//毫秒内序列溢出
if(sequence ==0) {
//阻塞到下一个毫秒,获得新的时间戳
timestamp = tilNextMillis(lastTimestamp);
}
}else{
// 时间戳改变,毫秒内序列重置
sequence =0L;
}
// 上次生成ID的时间截
lastTimestamp = timestamp;
// 移位并通过或运算拼到一起组成64位的ID
return((timestamp - timeToCut) << timestampLeftShift)
| (dataCenterId << dataCenterIdShift)
| (workerId << workerIdShift) | sequence;
}
/**
* 阻塞,获得新的时间戳
*/
privatelongtilNextMillis(longlastTimestamp){
longtimestamp = timeGen();
while(timestamp <= lastTimestamp) {
timestamp = timeGen();
}
returntimestamp;
}
/**
* 返回当前时间节点
*/
privatelongtimeGen(){
returnSystem.currentTimeMillis();
}
publicstaticvoidmain(String[] args){
// 参数在实际业务下需要配置管理
SnowIdWorkerUtil idWorker =newSnowIdWorkerUtil(1,1);
for(inti =0; i <100; i++) {
String id = idWorker.nextIdVar();
System.out.println(id+" "+id.length()+"位");
}
}
}
三、自定义实现
还有一种常见的实现思路,基于数据库的自增主键ID,不过基于这个原理,却有各种不同的实现策略。
简单表结构:
CREATETABLE`du_temp_id`(
`id`int(11)NOTNULLAUTO_INCREMENTCOMMENT'主键id',
`create_time`datetimeDEFAULTNULLCOMMENT'创建时间',
PRIMARYKEY(`id`)
)ENGINE=InnoDBDEFAULTCHARSET=utf8COMMENT='主键ID临时表';
1、基于主键
这种模式的原理比较单调,向临时表写入一条记录,借助MySQL生成的唯一主键ID,然后拿出来稍微处理一下,作为各种业务场景的唯一ID使用。
@Service
publicclassTempIdServiceImplimplementsTempIdService{
@Resource
privateTempIdMapper tempIdMapper ;
@Override
publicListgetIdList(){
List idList =newArrayList<>() ;
TempIdEntity tempIdEntity =newTempIdEntity ();
tempIdEntity.setCreateTime(newDate());
for(inti =0; i <10; i++){
tempIdMapper.insert(tempIdEntity);
idList.add(UuidUtil.getNoId(8,Long.parseLong(tempIdEntity.getId().toString()))) ;
}
returnidList ;
}
}
问题点:如果作为ID生成的临时表所在的MySQL服务宕掉,那可能会影响整个业务流程,造成雪崩效应。
2、高可用集群
单服务如果不能安稳的支撑业务需求,很自然集群模式就该上场了。提供多台MySQL服务[A,B,C],处理策略也不止一种:
库设置主键自增策略
例如A库[1,4,7],B库[2,5,8],C库[3,6,9],基于不同自增规则,生成统一的自增唯一标识。
生成ID做分库标识
这种先把ID生成,然后不同的数据库生成的ID给一个不同的标识,例如UIDA,UIDB,UIDC。
@Service
publicclassTempIdServiceImplimplementsTempIdService{
@Resource
privateTempIdMapper tempIdMapper ;
@Override
publicListgetRouteIdList(){
List idList =newArrayList<>() ;
TempIdEntity tempIdEntity =newTempIdEntity ();
tempIdEntity.setCreateTime(newDate());
for(inti =0; i <2; i++){
tempIdMapper.insertA(tempIdEntity);
idList.add(UuidUtil.getRouteId("UID-A",10,
Long.parseLong(tempIdEntity.getId().toString()))) ;
tempIdMapper.insertB(tempIdEntity);
idList.add(UuidUtil.getRouteId("UID-B",10,
Long.parseLong(tempIdEntity.getId().toString()))) ;
tempIdMapper.insertC(tempIdEntity);
idList.add(UuidUtil.getRouteId("UID-C",10,
Long.parseLong(tempIdEntity.getId().toString()))) ;
}
returnidList ;
}
}
结果样例:
UID-A00001,UID-B00001,UID-C00001
UID-A00002,UID-B00002,UID-C00002
3、ID样式优化
从数据获取的ID基本是一个自增的整数序列,可以提供一个格式美化工具方法。
publicclassUuidUtil{
privatestaticfinalString ZERO ="00000000000";
privatestaticfinalString PREFIX ="UID";
publicstaticStringgetNoId(intlength,Long id){
String idVar = String.valueOf(id) ;
if(idVar.length()>length){
returnPREFIX+idVar ;
}else{
intgapLen = length-idVar.length()-PREFIX.length() ;
returnPREFIX+ZERO.substring(0,gapLen)+idVar ;
}
}
publicstaticStringgetRouteId(String route,Integer length,Long id){
String idVar = String.valueOf(id) ;
if(idVar.length()>length){
returnroute+idVar ;
}else{
intgapLen = length-idVar.length()-route.length() ;
returnroute+ZERO.substring(0,gapLen)+idVar ;
}
}
}
基于不同的策略,把ID格式为统一的位数。
4、性能问题
如果在高并发的业务场景下,实时基于MySQL去生成唯一ID容易产生性能瓶颈,当然其他方法也可能产生这个问题。可以在系统空闲时间批量生成一批,放入缓存中,在使用的时候直接从缓存层取出即可。
四、源代码地址
GitHub·地址
https://github.com/cicadasmile/data-manage-parent
GitEE·地址
https://gitee.com/cicadasmile/data-manage-parent