Redis高并发架构实战

2021-05-05  本文已影响0人  YonchanLew

(1)先来一个小案例作为切入点

/*
这里记为代码一
*/
@RestController
public class IndexController {

    @Autowired
    private Redisson redisson;
    @Autowired
    private StringRedisTemplate stringRedisTemplate;    //组件spring-boot-starter-data-redis

    @RequestMapping("/deduct_stock")
    public String deductStock(){
        int stock = Integer.parseInt(stringRedisTemplate.opsForValue().get("stock"));   //可以理解为jedis.get("stock")
        if(stock > 0){
            int realStock = stock - 1;
            stringRedisTemplate.opsForValue().set("Stock", realStock + "");     //可以理解为jedis.set(key,value)
            System.out.println("扣减成功,剩余库存:" + realStock);
        }else{
            System.out.println("扣减失败,库存不足");
        }

        return "end";
    }
}

然后在redis中搞一个库存为200


现在很明显,代码一 存在线程安全问题,会有可能读到都是200,然后都减1后设置为199,就不对了。
很多同学都会想到加一把锁

(2)synchronized

/*
代码二
*/
public String deductStock(){
    synchronized (this){
        int stock = Integer.parseInt(stringRedisTemplate.opsForValue().get("stock"));   //可以理解为jedis.get("stock")
        if(stock > 0){
            int realStock = stock - 1;
            stringRedisTemplate.opsForValue().set("Stock", realStock + "");     //可以理解为jedis.set(key,value)
            System.out.println("扣减成功,剩余库存:" + realStock);
        }else{
            System.out.println("扣减失败,库存不足");
        }
    }

    return "end";
}

这样的确是只能有一个线程执行操作,确实是线程安全了。但是它只能在单机环境下运行,只能锁住一个tomcat,分布式的时候就不行了。


(3)分布式锁

这时,应该考虑分布式锁。SETNX(SET if Not eXists)。和set的区别是:
set tuling A
set tuling B
结果会是B
setnx tuling A
setnx tuling B
结果会是A

/*
代码三
*/
public String deductStock(){

    String lockKey = "product_101";
    //如果返回false,说明redis中有这个key了,不做任何操作。如果返回true说明执行这个命令之前没有这个key,并设置成功了
    Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, "tuling");     //就理解为jedis.setnx(key,value)
    if(!result){
        return "error_code";    //给前端错误码,当前系统繁忙,请稍后再试
    }

    int stock = Integer.parseInt(stringRedisTemplate.opsForValue().get("stock"));   //可以理解为jedis.get("stock")
    if(stock > 0){
        int realStock = stock - 1;
        stringRedisTemplate.opsForValue().set("Stock", realStock + "");     //可以理解为jedis.set(key,value)
        System.out.println("扣减成功,剩余库存:" + realStock);
    }else{
        System.out.println("扣减失败,库存不足");
    }

    stringRedisTemplate.delete(lockKey);

    return "end";
}

redis那边是单线程操作的,会排队,只有排队头的可以设置成功,后面的设置不成功,这样入门级的分布式锁设计完了。大家想想还有没有问题?
这个时候还是存在问题,当获取到锁的线程有异常,导致没法删除key,就会导致其他线程获取不到锁,就算能捕获异常,但如果是系统挂了呢,运维重启呢

/*
代码四
*/
public String deductStock(){

    String lockKey = "product_101";
    //如果返回false,说明redis中有这个key了,不做任何操作。如果返回true说明执行这个命令之前没有这个key,并设置成功了
    Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, "tuling");     //就理解为jedis.setnx(key,value)
    if(!result){
        return "error_code";    //给前端错误码,当前系统繁忙,请稍后再试
    }

    try{
        int stock = Integer.parseInt(stringRedisTemplate.opsForValue().get("stock"));   //可以理解为jedis.get("stock")
        if(stock > 0){
            int realStock = stock - 1;
            stringRedisTemplate.opsForValue().set("Stock", realStock + "");     //可以理解为jedis.set(key,value)
            System.out.println("扣减成功,剩余库存:" + realStock);
        }else{
            System.out.println("扣减失败,库存不足");
        }
    }finally {
        stringRedisTemplate.delete(lockKey);
    }

    return "end";
}

示例 代码四 还是存在问题,大家先想想解决方法。

(4)锁超时

这样的话,可以加一个超时时间来解决,给key一个超时时间,即使系统挂了,一段时间之后,其他机器还是能正常访问

/*
代码五
*/
public String deductStock(){

    String lockKey = "product_101";
    //如果返回false,说明redis中有这个key了,不做任何操作。如果返回true说明执行这个命令之前没有这个key,并设置成功了
    Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, "tuling");     //就理解为jedis.setnx(key,value)
    stringRedisTemplate.expire(lockKey, 10, TimeUnit.SECONDS);

    if(!result){
        return "error_code";    //给前端错误码,当前系统繁忙,请稍后再试
    }

    try{
        int stock = Integer.parseInt(stringRedisTemplate.opsForValue().get("stock"));   //可以理解为jedis.get("stock")
        if(stock > 0){
            int realStock = stock - 1;
            stringRedisTemplate.opsForValue().set("Stock", realStock + "");     //可以理解为jedis.set(key,value)
            System.out.println("扣减成功,剩余库存:" + realStock);
        }else{
            System.out.println("扣减失败,库存不足");
        }
    }finally {
        stringRedisTemplate.delete(lockKey);
    }

    return "end";
}

大家想想 代码五 还有问题吗?

(5)加锁操作原子性

假设设置了key之后,正准备设置超时时间,但系统挂了,那还是回到之前的问题了,得保证原子性。应该使用setIfAbsent的其他重载方法,有一个是可以同时设置超时时间的

/*
代码六
*/
public String deductStock(){

    String lockKey = "product_101";
    //如果返回false,说明redis中有这个key了,不做任何操作。如果返回true说明执行这个命令之前没有这个key,并设置成功了
//        Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, "tuling");     //就理解为jedis.setnx(key,value)
//        stringRedisTemplate.expire(lockKey, 10, TimeUnit.SECONDS);

    Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, "tuling", 10, TimeUnit.SECONDS);

    if(!result){
        return "error_code";    //给前端错误码,当前系统繁忙,请稍后再试
    }

    try{
        int stock = Integer.parseInt(stringRedisTemplate.opsForValue().get("stock"));   //可以理解为jedis.get("stock")
        if(stock > 0){
            int realStock = stock - 1;
            stringRedisTemplate.opsForValue().set("Stock", realStock + "");     //可以理解为jedis.set(key,value)
            System.out.println("扣减成功,剩余库存:" + realStock);
        }else{
            System.out.println("扣减失败,库存不足");
        }
    }finally {
        stringRedisTemplate.delete(lockKey);
    }

    return "end";
}

大家思考一下,代码六 还有没有问题?
遇到高并发的时候,通常执行会比较慢,慢执行啊,中间sql语句执行很慢这样,假设执行完这个方法需要15秒,当线程执行了10秒的时候,由于设置了超时时间是10秒,并且是高并发场景,这个时候key就删除了,另外的线程就获取了锁

这样就相当于锁永久失效。虽然把过期时间放大是可以避免,但还是无法彻底解决问题。
本质是自己加的锁被别人解掉了,所以解决就是锁只能自己解锁

/*
代码七
*/
public String deductStock(){

    String lockKey = "product_101";
    //如果返回false,说明redis中有这个key了,不做任何操作。如果返回true说明执行这个命令之前没有这个key,并设置成功了
//        Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, "tuling");     //就理解为jedis.setnx(key,value)
//        stringRedisTemplate.expire(lockKey, 10, TimeUnit.SECONDS);

    String clientId = UUID.randomUUID().toString();

    Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, clientId, 10, TimeUnit.SECONDS);

    if(!result){
        return "error_code";    //给前端错误码,当前系统繁忙,请稍后再试
    }

    try{
        int stock = Integer.parseInt(stringRedisTemplate.opsForValue().get("stock"));   //可以理解为jedis.get("stock")
        if(stock > 0){
            int realStock = stock - 1;
            stringRedisTemplate.opsForValue().set("Stock", realStock + "");     //可以理解为jedis.set(key,value)
            System.out.println("扣减成功,剩余库存:" + realStock);
        }else{
            System.out.println("扣减失败,库存不足");
        }
    }finally {
        if(clientId.equals(stringRedisTemplate.opsForValue().get(lockKey))){
            stringRedisTemplate.delete(lockKey);
        }
    }

    return "end";
}

代码七 按上面的例子,锁是自己过期的,这代码只是能保证线程1无法删除线程2的锁,但线程1和线程2还是同时在跑啊。这个时间还有问题,但是先不管,先放放,因为不是想要引申的内容,要继续思考这个代码还有除时间外的什么其他问题?
就是finally中的两行代码非原子,写并发代码和写高并发代码时的区别,应该要习惯性的在代码之间空几行,表明这里执行有时间差,非原子。
假设执行判断完clientId确实是等于当前线程的value,假设这时刚好是9.9秒,突然发生卡顿,但这个if判断已经是true了,正准备delete的时候,卡顿了,这时已经过了10秒,线程2已经获取了锁,然后线程1执行delete,又出问题了,仍然是线程1删除了线程2的锁。
怎么处理?

(6)锁续命

锁续命:通常是这样处理的,有一个分线程定时任务,用来监测线程还是否持有锁,还持有的就延长锁的过期时间,例如锁超时是30秒,那么分线程每10秒判断一下,线程还是否持有锁,还持有就更新过期时间,不能说是延长,是按当前时间又重新设置30秒过期,当不持有了,定时任务就结束,分线程也结束。
redisson:操作redis的客户端,有很多分布式功能,其中就有分布式锁。想起了吧?代码一 中就已经引入了redisson

/*
代码八
*/
public String deductStock(){

    String lockKey = "product_101";
    //如果返回false,说明redis中有这个key了,不做任何操作。如果返回true说明执行这个命令之前没有这个key,并设置成功了
//        Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, "tuling");     //就理解为jedis.setnx(key,value)
//        stringRedisTemplate.expire(lockKey, 10, TimeUnit.SECONDS);

    /*String clientId = UUID.randomUUID().toString();
    Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, clientId, 10, TimeUnit.SECONDS);
    if(!result){
        return "error_code";    //给前端错误码,当前系统繁忙,请稍后再试
    }*/

    RLock redissonLock = redisson.getLock(lockKey);

    try{
        //加锁
        redissonLock.lock();    //理解为执行了setIfAbsent(lockKey, clientId, 30, TimeUnit.SECONDS)
        int stock = Integer.parseInt(stringRedisTemplate.opsForValue().get("stock"));   //可以理解为jedis.get("stock")
        if(stock > 0){
            int realStock = stock - 1;
            stringRedisTemplate.opsForValue().set("Stock", realStock + "");     //可以理解为jedis.set(key,value)
            System.out.println("扣减成功,剩余库存:" + realStock);
        }else{
            System.out.println("扣减失败,库存不足");
        }
    }finally {
        redissonLock.unlock();
        /*if(clientId.equals(stringRedisTemplate.opsForValue().get(lockKey))){
            stringRedisTemplate.delete(lockKey);
        }*/
    }

    return "end";
}

redisson加锁核心lua脚本


KEYS[1]:product_101
ARGV[2]:getLockName(threadId)
ARGV[1]:internalLockLeaseTime(初始化是30秒)
可以看到第250行和251行,就相当于 代码五 中的

Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, "tuling");     //就理解为jedis.setnx(key,value)
stringRedisTemplate.expire(lockKey, 10, TimeUnit.SECONDS);

而这两行代码是不具有原子性的,线程不安全。Lua脚本可以保证原子性

锁续命:

/*
https://github.com/redisson/redisson/blob/redisson-3.6.5/redisson/src/main/java/org/redisson/RedissonLock.java
redisson-3.6.5 RedissonLock.java,其他版本会不太不一样,但原理应该不变吧
*/
    private void scheduleExpirationRenewal(final long threadId) {
        if (expirationRenewalMap.containsKey(getEntryName())) {
            return;
        }

        Timeout task = commandExecutor.getConnectionManager().newTimeout(new TimerTask() {
            @Override
            public void run(Timeout timeout) throws Exception {

                RFuture<Boolean> future = commandExecutor.evalWriteAsync(getName(), LongCodec.INSTANCE, RedisCommands.EVAL_BOOLEAN,
                        "if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then " +
                            "redis.call('pexpire', KEYS[1], ARGV[1]); " +
                            "return 1; " +
                        "end; " +
                        "return 0;",
                          Collections.<Object>singletonList(getName()), internalLockLeaseTime, getLockName(threadId));

                future.addListener(new FutureListener<Boolean>() {
                    @Override
                    public void operationComplete(Future<Boolean> future) throws Exception {
                        expirationRenewalMap.remove(getEntryName());
                        if (!future.isSuccess()) {
                            log.error("Can't update lock " + getName() + " expiration", future.cause());
                            return;
                        }

                        if (future.getNow()) {
                            // reschedule itself
                            scheduleExpirationRenewal(threadId);
                        }
                    }
                });
            }
        }, internalLockLeaseTime / 3, TimeUnit.MILLISECONDS);

        if (expirationRenewalMap.putIfAbsent(getEntryName(), task) != null) {
            task.cancel();
        }
    }

它延迟 internalLockLeaseTime / 3 秒执行run方法,为它重新设置expire为 internalLockLeaseTime
commandExecutor.evalWriteAsync返回了一个future,然后future又添加监听器,最后执行当前方法scheduleExpirationRenewal(threadId);,就是一直重复续命,又再延迟调用,相当于定时任务。

到目前为止,基本就没有什么坑了,redisson已经是填了很多坑,可以放心使用 代码八 进行实现。
但是,还有点问题,假设有多个请求在执行redissonLock.lock()加锁,只能有一个线程在处理,其他都得等着,系统就会很慢,存在性能问题,该怎么优化能做到双十一能用的级别?

(7)zookeeper

redis一般都是有主从架构的,基本不会是单机使用


redis主节点马上告诉客户端加锁成功,线程1就执行业务代码逻辑,然后redis准备把key同步给从节点时候,结果主节点挂了,某个从节点选举成为新的Master主节点,来了个线程3访问新的主节点加锁,线程3就发现没有product_101这个key,又可以加锁成功了,线程1业务逻辑还没执行完毕,线程3就开始执行,就又出现了问题


主从架构锁失效的问题,可以用zookeeper来实现分布式锁,和redis类似,是树形结构。redis更多的实现是AP架构,zookeeper更多的实现是CAP架构。
zookeeper的话,当要写一个key,不是就立即返回成功的,会先把key同步给集群的其他节点,子节点会返回同步成功的信息,主节点会判断是否已经有超过半数的子节点都同步成功,这时才告诉客户端成功了,是为了保证一致性,牺牲了及时响应,但它能保证那些已经同步了子节点才能成功leader,redis就没有这个机制,也就是线程3再来请求leader的时候,必然会有key,加锁就不成功,解决了上述问题。
但如果不使用zookeeper,就是要使用redis来解决呢?(因为redis的并发比zookeeper高不少)如果要高并发,就用redis,就有上述主从锁问题,如果要保证健壮性就用zookeeper,但牺牲了并发数。

(8)Redlock

硬是要使用redis的话,看看Redlock


redis没有主从关系,是对等的,往每个节点发送加锁命令,只有超过半数的节点返回成功才认为客户端加锁成功,和zookeeper原理类似。但这种方式不推荐,原来是一个redis节点,现在搞多个,要半数加锁成功,对我们加锁性能受一定影响,这样的话,还不如用zookeeper,因为redlock还有不少问题。

@RequestMapping("/redlock")
public String redlock(){

    String lockKey = "product_101";
    RLock lock1 = redisson.getLock(lockKey);
    RLock lock2 = redisson.getLock(lockKey);
    RLock lock3 = redisson.getLock(lockKey);

    //根据多个RLock对象构件RedissonRedLock
    RedissonRedLock redLock = new RedissonRedLock(lock1, lock2, lock3);

    try{
        /*
        * waitTimeout 尝试获取锁的最大等待时间,超过这个数,则认为获取锁失败
        * leaseTime   锁的持有时间,超过这个时间锁会自动失败(值应设置为大于业务处理的时间,确保在锁有效期内业务能处理完)
        * */
        boolean res = redLock.tryLock(10, 30, TimeUnit.SECONDS);
        if(res){
            //成功获取锁,处理业务
        }
    }catch (Exception e) {
        throw  new RuntimeException("lock fail");
    }finally {
        //无论如何,最后都要解锁
        redLock.unlock();
    }

    return "end";
}

回到 代码八,redissonLock.lock();会导致其他线程等待,也就是分布式锁把并行请求变串行化执行了。那么如何提升分布式锁性能?

(9)分段锁

模仿ConcurrentHashMap,分段锁。
假设product_101的数量是200,那么可以分十段,
product_101_1=20
product_101_2=20
product_101_3=20
......
product_101_10=20
200个库存分10个key存到redis中去,让每个线程去减不同的段位的库存,如果不够减的话就减一下个段位,实现的话有点难,但可以理解这个思想,就不再去扩展了。

(10)缓存数据库双写不一致

接下来说redis作为缓存使用的时候,常见问题有:缓存无底洞、缓存穿透、缓存雪崩、缓存失效、热点key倾斜、热点key重建、缓存数据库双写不一致。
这里针对缓存数据库双写不一致的问题说一下。
什么是缓存数据库双写不一致?

看上去线程1写数据库,然后更新缓存,线程2写数据库,然后更新缓存,没有什么问题,但如果线程1操作较慢(小卡顿)呢?


有些人就会说,通常不会直接更新缓存,而是把缓存删掉,即更新就删缓存,读数据的时候再设置缓存,的确这样是比较好,因为每次写完就更新缓存的话,如果不读缓存,相当于白更新。


但这样还是有问题


还有什么方法解决?

(11)解决双写不一致的方法

延迟双删:删缓存删两次,删除之后sleep(一段时间)后再删一次
但这种方法只能说是减少,并不能解决问题,并且还让所有的写请求都得sleep一段时间

内存队列:用hash运算把操作路由到某个队列中顺序执行。是可以解决,但复杂,写不好很可能有性能问题或是bug

还有没有其他解决方法?

问题的本质就是操作过程中不是原子性,如果(写数据库-删除缓存)是不可分割的操作,(查缓存-查数据库-更新缓存)是不可分割的操作,即在操作前加分布式锁,操作完后解锁,所有线程的操作为队列,把多个并发执行的线程串行化


直接这样上锁,性能肯定是有问题的,怎么优化?

(12)读多写少的情况

直接上分布式锁会有问题,使用读写锁
读写锁:读操作加读锁,写操作加写锁,读操作不互斥,写锁跟读锁、写锁跟写锁互斥。
由于很多系统都是读多写少的情况,所以可以提高性能

/*
代码九
*/
@RequestMapping("/get_stock")
public String getStock(@RequestParam("clientId") Long clientId) throws InterruptedException{

    String lockKey = "product_101";

    RReadWriteLock readWriteLock = redisson.getReadWriteLock(lockKey);
    RLock rLock = readWriteLock.readLock();

    rLock.lock();
    System.out.println("获取读锁成功:client="+clientId);
    String stock = stringRedisTemplate.opsForValue().get("stock");
    if(StringUtils.isEmpty(stock)){
        System.out.println("查询数据库库存为10。。。");
        Thread.sleep(5000);
        stringRedisTemplate.opsForValue().set("stock", 10);
    }
    rLock.unlock();
    System.out.println("释放读锁成功:client="+clientId);

    return "end";
}

@RequestMapping("/update_stock")
public String updateStock(@RequestParam("clientId") Long clientId) throws InterruptedException{

    String lockKey = "product_101";

    RReadWriteLock readWriteLock = redisson.getReadWriteLock(lockKey);
    RLock writeLock = readWriteLock.writeLock();

    writeLock.lock();
    System.out.println("获取写锁成功:client="+clientId);
    System.out.println("修改商品101的数据库库存为6。。。");
    stringRedisTemplate.delete("stock");
    Thread.sleep(5000);
    writeLock.unlock();
    System.out.println("释放写锁成功:client="+clientId);

    return "end";
}

原理就是lua脚本为每个key设置一个mode的值来记录是read还是write。
RedissonWriteLock.java


但如果读多写也多的情况呢,怎么处理?
不采用上面的方法,仍然是给缓存过期时间,然后操作的时候直接操作数据库。例如在页面上看到的库存,其实很多时候都是和数据库的值不一致的,就是为了实现高并发,又要用数据库又要用缓存,只能牺牲一致性,牺牲一致性其实关系并不大,想一想,假设一致的话,加入购物车、下订单,中间是有时间差的,这个时候可能就没有了库存了,对用户来说是不一致,但对程序来说,程序以及保证了一致,只是意义不大,所以牺牲一致性来提高性能。假设过期时间是一分钟,那在这一分钟内可能是不一致,但如果一分钟后库存不变,又读取更新了缓存,这个时候就变一致了,只需要确保在下单的时候是用db的数据即可。

(13)读多写多的情况

如果是读多写多,又要保证缓存数据库一致性,怎么办?
对读多写多的场景,就不应该用缓存,直接操作数据库就好了,对吧。
也有方法既使用缓存,又应对读多写多的场景,中间件canal。后面就学不着了,需要报课。。。。以后再看看

上一篇下一篇

猜你喜欢

热点阅读