Redis高并发架构实战
(1)先来一个小案例作为切入点
/*
这里记为代码一
*/
@RestController
public class IndexController {
@Autowired
private Redisson redisson;
@Autowired
private StringRedisTemplate stringRedisTemplate; //组件spring-boot-starter-data-redis
@RequestMapping("/deduct_stock")
public String deductStock(){
int stock = Integer.parseInt(stringRedisTemplate.opsForValue().get("stock")); //可以理解为jedis.get("stock")
if(stock > 0){
int realStock = stock - 1;
stringRedisTemplate.opsForValue().set("Stock", realStock + ""); //可以理解为jedis.set(key,value)
System.out.println("扣减成功,剩余库存:" + realStock);
}else{
System.out.println("扣减失败,库存不足");
}
return "end";
}
}
然后在redis中搞一个库存为200
现在很明显,代码一
存在线程安全问题,会有可能读到都是200,然后都减1后设置为199,就不对了。
很多同学都会想到加一把锁
(2)synchronized
/*
代码二
*/
public String deductStock(){
synchronized (this){
int stock = Integer.parseInt(stringRedisTemplate.opsForValue().get("stock")); //可以理解为jedis.get("stock")
if(stock > 0){
int realStock = stock - 1;
stringRedisTemplate.opsForValue().set("Stock", realStock + ""); //可以理解为jedis.set(key,value)
System.out.println("扣减成功,剩余库存:" + realStock);
}else{
System.out.println("扣减失败,库存不足");
}
}
return "end";
}
这样的确是只能有一个线程执行操作,确实是线程安全了。但是它只能在单机环境下运行,只能锁住一个tomcat,分布式的时候就不行了。
(3)分布式锁
这时,应该考虑分布式锁。SETNX(SET if Not eXists)。和set的区别是:
set tuling A
set tuling B
结果会是B
setnx tuling A
setnx tuling B
结果会是A
/*
代码三
*/
public String deductStock(){
String lockKey = "product_101";
//如果返回false,说明redis中有这个key了,不做任何操作。如果返回true说明执行这个命令之前没有这个key,并设置成功了
Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, "tuling"); //就理解为jedis.setnx(key,value)
if(!result){
return "error_code"; //给前端错误码,当前系统繁忙,请稍后再试
}
int stock = Integer.parseInt(stringRedisTemplate.opsForValue().get("stock")); //可以理解为jedis.get("stock")
if(stock > 0){
int realStock = stock - 1;
stringRedisTemplate.opsForValue().set("Stock", realStock + ""); //可以理解为jedis.set(key,value)
System.out.println("扣减成功,剩余库存:" + realStock);
}else{
System.out.println("扣减失败,库存不足");
}
stringRedisTemplate.delete(lockKey);
return "end";
}
redis那边是单线程操作的,会排队,只有排队头的可以设置成功,后面的设置不成功,这样入门级的分布式锁设计完了。大家想想还有没有问题?
这个时候还是存在问题,当获取到锁的线程有异常,导致没法删除key,就会导致其他线程获取不到锁,就算能捕获异常,但如果是系统挂了呢,运维重启呢
/*
代码四
*/
public String deductStock(){
String lockKey = "product_101";
//如果返回false,说明redis中有这个key了,不做任何操作。如果返回true说明执行这个命令之前没有这个key,并设置成功了
Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, "tuling"); //就理解为jedis.setnx(key,value)
if(!result){
return "error_code"; //给前端错误码,当前系统繁忙,请稍后再试
}
try{
int stock = Integer.parseInt(stringRedisTemplate.opsForValue().get("stock")); //可以理解为jedis.get("stock")
if(stock > 0){
int realStock = stock - 1;
stringRedisTemplate.opsForValue().set("Stock", realStock + ""); //可以理解为jedis.set(key,value)
System.out.println("扣减成功,剩余库存:" + realStock);
}else{
System.out.println("扣减失败,库存不足");
}
}finally {
stringRedisTemplate.delete(lockKey);
}
return "end";
}
示例 代码四
还是存在问题,大家先想想解决方法。
(4)锁超时
这样的话,可以加一个超时时间来解决,给key一个超时时间,即使系统挂了,一段时间之后,其他机器还是能正常访问
/*
代码五
*/
public String deductStock(){
String lockKey = "product_101";
//如果返回false,说明redis中有这个key了,不做任何操作。如果返回true说明执行这个命令之前没有这个key,并设置成功了
Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, "tuling"); //就理解为jedis.setnx(key,value)
stringRedisTemplate.expire(lockKey, 10, TimeUnit.SECONDS);
if(!result){
return "error_code"; //给前端错误码,当前系统繁忙,请稍后再试
}
try{
int stock = Integer.parseInt(stringRedisTemplate.opsForValue().get("stock")); //可以理解为jedis.get("stock")
if(stock > 0){
int realStock = stock - 1;
stringRedisTemplate.opsForValue().set("Stock", realStock + ""); //可以理解为jedis.set(key,value)
System.out.println("扣减成功,剩余库存:" + realStock);
}else{
System.out.println("扣减失败,库存不足");
}
}finally {
stringRedisTemplate.delete(lockKey);
}
return "end";
}
大家想想 代码五
还有问题吗?
(5)加锁操作原子性
假设设置了key之后,正准备设置超时时间,但系统挂了,那还是回到之前的问题了,得保证原子性。应该使用setIfAbsent的其他重载方法,有一个是可以同时设置超时时间的
/*
代码六
*/
public String deductStock(){
String lockKey = "product_101";
//如果返回false,说明redis中有这个key了,不做任何操作。如果返回true说明执行这个命令之前没有这个key,并设置成功了
// Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, "tuling"); //就理解为jedis.setnx(key,value)
// stringRedisTemplate.expire(lockKey, 10, TimeUnit.SECONDS);
Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, "tuling", 10, TimeUnit.SECONDS);
if(!result){
return "error_code"; //给前端错误码,当前系统繁忙,请稍后再试
}
try{
int stock = Integer.parseInt(stringRedisTemplate.opsForValue().get("stock")); //可以理解为jedis.get("stock")
if(stock > 0){
int realStock = stock - 1;
stringRedisTemplate.opsForValue().set("Stock", realStock + ""); //可以理解为jedis.set(key,value)
System.out.println("扣减成功,剩余库存:" + realStock);
}else{
System.out.println("扣减失败,库存不足");
}
}finally {
stringRedisTemplate.delete(lockKey);
}
return "end";
}
大家思考一下,代码六
还有没有问题?
遇到高并发的时候,通常执行会比较慢,慢执行啊,中间sql语句执行很慢这样,假设执行完这个方法需要15秒,当线程执行了10秒的时候,由于设置了超时时间是10秒,并且是高并发场景,这个时候key就删除了,另外的线程就获取了锁
这样就相当于锁永久失效。虽然把过期时间放大是可以避免,但还是无法彻底解决问题。
本质是自己加的锁被别人解掉了,所以解决就是锁只能自己解锁
/*
代码七
*/
public String deductStock(){
String lockKey = "product_101";
//如果返回false,说明redis中有这个key了,不做任何操作。如果返回true说明执行这个命令之前没有这个key,并设置成功了
// Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, "tuling"); //就理解为jedis.setnx(key,value)
// stringRedisTemplate.expire(lockKey, 10, TimeUnit.SECONDS);
String clientId = UUID.randomUUID().toString();
Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, clientId, 10, TimeUnit.SECONDS);
if(!result){
return "error_code"; //给前端错误码,当前系统繁忙,请稍后再试
}
try{
int stock = Integer.parseInt(stringRedisTemplate.opsForValue().get("stock")); //可以理解为jedis.get("stock")
if(stock > 0){
int realStock = stock - 1;
stringRedisTemplate.opsForValue().set("Stock", realStock + ""); //可以理解为jedis.set(key,value)
System.out.println("扣减成功,剩余库存:" + realStock);
}else{
System.out.println("扣减失败,库存不足");
}
}finally {
if(clientId.equals(stringRedisTemplate.opsForValue().get(lockKey))){
stringRedisTemplate.delete(lockKey);
}
}
return "end";
}
代码七
按上面的例子,锁是自己过期的,这代码只是能保证线程1无法删除线程2的锁,但线程1和线程2还是同时在跑啊。这个时间还有问题,但是先不管,先放放,因为不是想要引申的内容,要继续思考这个代码还有除时间外的什么其他问题?
就是finally中的两行代码非原子,写并发代码和写高并发代码时的区别,应该要习惯性的在代码之间空几行,表明这里执行有时间差,非原子。
假设执行判断完clientId确实是等于当前线程的value,假设这时刚好是9.9秒,突然发生卡顿,但这个if判断已经是true了,正准备delete的时候,卡顿了,这时已经过了10秒,线程2已经获取了锁,然后线程1执行delete,又出问题了,仍然是线程1删除了线程2的锁。
怎么处理?
(6)锁续命
锁续命
:通常是这样处理的,有一个分线程定时任务,用来监测线程还是否持有锁,还持有的就延长锁的过期时间,例如锁超时是30秒,那么分线程每10秒判断一下,线程还是否持有锁,还持有就更新过期时间,不能说是延长,是按当前时间又重新设置30秒过期,当不持有了,定时任务就结束,分线程也结束。
redisson:操作redis的客户端,有很多分布式功能,其中就有分布式锁。想起了吧?代码一
中就已经引入了redisson
/*
代码八
*/
public String deductStock(){
String lockKey = "product_101";
//如果返回false,说明redis中有这个key了,不做任何操作。如果返回true说明执行这个命令之前没有这个key,并设置成功了
// Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, "tuling"); //就理解为jedis.setnx(key,value)
// stringRedisTemplate.expire(lockKey, 10, TimeUnit.SECONDS);
/*String clientId = UUID.randomUUID().toString();
Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, clientId, 10, TimeUnit.SECONDS);
if(!result){
return "error_code"; //给前端错误码,当前系统繁忙,请稍后再试
}*/
RLock redissonLock = redisson.getLock(lockKey);
try{
//加锁
redissonLock.lock(); //理解为执行了setIfAbsent(lockKey, clientId, 30, TimeUnit.SECONDS)
int stock = Integer.parseInt(stringRedisTemplate.opsForValue().get("stock")); //可以理解为jedis.get("stock")
if(stock > 0){
int realStock = stock - 1;
stringRedisTemplate.opsForValue().set("Stock", realStock + ""); //可以理解为jedis.set(key,value)
System.out.println("扣减成功,剩余库存:" + realStock);
}else{
System.out.println("扣减失败,库存不足");
}
}finally {
redissonLock.unlock();
/*if(clientId.equals(stringRedisTemplate.opsForValue().get(lockKey))){
stringRedisTemplate.delete(lockKey);
}*/
}
return "end";
}
redisson加锁核心lua脚本
KEYS[1]:product_101
ARGV[2]:getLockName(threadId)
ARGV[1]:internalLockLeaseTime(初始化是30秒)
可以看到第250行和251行,就相当于 代码五
中的
Boolean result = stringRedisTemplate.opsForValue().setIfAbsent(lockKey, "tuling"); //就理解为jedis.setnx(key,value)
stringRedisTemplate.expire(lockKey, 10, TimeUnit.SECONDS);
而这两行代码是不具有原子性的,线程不安全。Lua脚本可以保证原子性
锁续命:
/*
https://github.com/redisson/redisson/blob/redisson-3.6.5/redisson/src/main/java/org/redisson/RedissonLock.java
redisson-3.6.5 RedissonLock.java,其他版本会不太不一样,但原理应该不变吧
*/
private void scheduleExpirationRenewal(final long threadId) {
if (expirationRenewalMap.containsKey(getEntryName())) {
return;
}
Timeout task = commandExecutor.getConnectionManager().newTimeout(new TimerTask() {
@Override
public void run(Timeout timeout) throws Exception {
RFuture<Boolean> future = commandExecutor.evalWriteAsync(getName(), LongCodec.INSTANCE, RedisCommands.EVAL_BOOLEAN,
"if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then " +
"redis.call('pexpire', KEYS[1], ARGV[1]); " +
"return 1; " +
"end; " +
"return 0;",
Collections.<Object>singletonList(getName()), internalLockLeaseTime, getLockName(threadId));
future.addListener(new FutureListener<Boolean>() {
@Override
public void operationComplete(Future<Boolean> future) throws Exception {
expirationRenewalMap.remove(getEntryName());
if (!future.isSuccess()) {
log.error("Can't update lock " + getName() + " expiration", future.cause());
return;
}
if (future.getNow()) {
// reschedule itself
scheduleExpirationRenewal(threadId);
}
}
});
}
}, internalLockLeaseTime / 3, TimeUnit.MILLISECONDS);
if (expirationRenewalMap.putIfAbsent(getEntryName(), task) != null) {
task.cancel();
}
}
它延迟 internalLockLeaseTime / 3
秒执行run方法,为它重新设置expire为 internalLockLeaseTime
。
commandExecutor.evalWriteAsync
返回了一个future
,然后future
又添加监听器,最后执行当前方法scheduleExpirationRenewal(threadId);
,就是一直重复续命,又再延迟调用,相当于定时任务。
到目前为止,基本就没有什么坑了,redisson已经是填了很多坑,可以放心使用 代码八
进行实现。
但是,还有点问题,假设有多个请求在执行redissonLock.lock()加锁,只能有一个线程在处理,其他都得等着,系统就会很慢,存在性能问题,该怎么优化能做到双十一能用的级别?
(7)zookeeper
redis一般都是有主从架构的,基本不会是单机使用
redis主节点马上告诉客户端加锁成功,线程1就执行业务代码逻辑,然后redis准备把key同步给从节点时候,结果主节点挂了,某个从节点选举成为新的Master主节点,来了个线程3访问新的主节点加锁,线程3就发现没有product_101这个key,又可以加锁成功了,线程1业务逻辑还没执行完毕,线程3就开始执行,就又出现了问题
主从架构锁失效的问题,可以用zookeeper来实现分布式锁,和redis类似,是树形结构。redis更多的实现是AP架构,zookeeper更多的实现是CAP架构。
zookeeper的话,当要写一个key,不是就立即返回成功的,会先把key同步给集群的其他节点,子节点会返回同步成功的信息,主节点会判断是否已经有超过半数的子节点都同步成功,这时才告诉客户端成功了,是为了保证一致性,牺牲了及时响应,但它能保证那些已经同步了子节点才能成功leader,redis就没有这个机制,也就是线程3再来请求leader的时候,必然会有key,加锁就不成功,解决了上述问题。
但如果不使用zookeeper,就是要使用redis来解决呢?(因为redis的并发比zookeeper高不少)如果要高并发,就用redis,就有上述主从锁问题,如果要保证健壮性就用zookeeper,但牺牲了并发数。
(8)Redlock
硬是要使用redis的话,看看Redlock
redis没有主从关系,是对等的,往每个节点发送加锁命令,只有超过半数的节点返回成功才认为客户端加锁成功,和zookeeper原理类似。但这种方式不推荐,原来是一个redis节点,现在搞多个,要半数加锁成功,对我们加锁性能受一定影响,这样的话,还不如用zookeeper,因为redlock还有不少问题。
@RequestMapping("/redlock")
public String redlock(){
String lockKey = "product_101";
RLock lock1 = redisson.getLock(lockKey);
RLock lock2 = redisson.getLock(lockKey);
RLock lock3 = redisson.getLock(lockKey);
//根据多个RLock对象构件RedissonRedLock
RedissonRedLock redLock = new RedissonRedLock(lock1, lock2, lock3);
try{
/*
* waitTimeout 尝试获取锁的最大等待时间,超过这个数,则认为获取锁失败
* leaseTime 锁的持有时间,超过这个时间锁会自动失败(值应设置为大于业务处理的时间,确保在锁有效期内业务能处理完)
* */
boolean res = redLock.tryLock(10, 30, TimeUnit.SECONDS);
if(res){
//成功获取锁,处理业务
}
}catch (Exception e) {
throw new RuntimeException("lock fail");
}finally {
//无论如何,最后都要解锁
redLock.unlock();
}
return "end";
}
回到 代码八
,redissonLock.lock();会导致其他线程等待,也就是分布式锁把并行请求变串行化执行了。那么如何提升分布式锁性能?
(9)分段锁
模仿ConcurrentHashMap,分段锁。
假设product_101的数量是200,那么可以分十段,
product_101_1=20
product_101_2=20
product_101_3=20
......
product_101_10=20
200个库存分10个key存到redis中去,让每个线程去减不同的段位的库存,如果不够减的话就减一下个段位,实现的话有点难,但可以理解这个思想,就不再去扩展了。
(10)缓存数据库双写不一致
接下来说redis作为缓存使用的时候,常见问题有:缓存无底洞、缓存穿透、缓存雪崩、缓存失效、热点key倾斜、热点key重建、缓存数据库双写不一致。
这里针对缓存数据库双写不一致的问题说一下。
什么是缓存数据库双写不一致?
看上去线程1写数据库,然后更新缓存,线程2写数据库,然后更新缓存,没有什么问题,但如果线程1操作较慢(小卡顿)呢?
有些人就会说,通常不会直接更新缓存,而是把缓存删掉,即更新就删缓存,读数据的时候再设置缓存,的确这样是比较好,因为每次写完就更新缓存的话,如果不读缓存,相当于白更新。
但这样还是有问题
还有什么方法解决?
(11)解决双写不一致的方法
延迟双删:删缓存删两次,删除之后sleep(一段时间)后再删一次
但这种方法只能说是减少,并不能解决问题,并且还让所有的写请求都得sleep一段时间
内存队列:用hash运算把操作路由到某个队列中顺序执行。是可以解决,但复杂,写不好很可能有性能问题或是bug
还有没有其他解决方法?
问题的本质就是操作过程中不是原子性,如果(写数据库-删除缓存)是不可分割的操作,(查缓存-查数据库-更新缓存)是不可分割的操作,即在操作前加分布式锁,操作完后解锁,所有线程的操作为队列,把多个并发执行的线程串行化
直接这样上锁,性能肯定是有问题的,怎么优化?
(12)读多写少的情况
直接上分布式锁会有问题,使用读写锁
读写锁:读操作加读锁,写操作加写锁,读操作不互斥,写锁跟读锁、写锁跟写锁互斥。
由于很多系统都是读多写少的情况,所以可以提高性能
/*
代码九
*/
@RequestMapping("/get_stock")
public String getStock(@RequestParam("clientId") Long clientId) throws InterruptedException{
String lockKey = "product_101";
RReadWriteLock readWriteLock = redisson.getReadWriteLock(lockKey);
RLock rLock = readWriteLock.readLock();
rLock.lock();
System.out.println("获取读锁成功:client="+clientId);
String stock = stringRedisTemplate.opsForValue().get("stock");
if(StringUtils.isEmpty(stock)){
System.out.println("查询数据库库存为10。。。");
Thread.sleep(5000);
stringRedisTemplate.opsForValue().set("stock", 10);
}
rLock.unlock();
System.out.println("释放读锁成功:client="+clientId);
return "end";
}
@RequestMapping("/update_stock")
public String updateStock(@RequestParam("clientId") Long clientId) throws InterruptedException{
String lockKey = "product_101";
RReadWriteLock readWriteLock = redisson.getReadWriteLock(lockKey);
RLock writeLock = readWriteLock.writeLock();
writeLock.lock();
System.out.println("获取写锁成功:client="+clientId);
System.out.println("修改商品101的数据库库存为6。。。");
stringRedisTemplate.delete("stock");
Thread.sleep(5000);
writeLock.unlock();
System.out.println("释放写锁成功:client="+clientId);
return "end";
}
原理就是lua脚本为每个key设置一个mode的值来记录是read还是write。
RedissonWriteLock.java
但如果读多写也多的情况呢,怎么处理?
不采用上面的方法,仍然是给缓存过期时间,然后操作的时候直接操作数据库。例如在页面上看到的库存,其实很多时候都是和数据库的值不一致的,就是为了实现高并发,又要用数据库又要用缓存,只能牺牲一致性,牺牲一致性其实关系并不大,想一想,假设一致的话,加入购物车、下订单,中间是有时间差的,这个时候可能就没有了库存了,对用户来说是不一致,但对程序来说,程序以及保证了一致,只是意义不大,所以牺牲一致性来提高性能。假设过期时间是一分钟,那在这一分钟内可能是不一致,但如果一分钟后库存不变,又读取更新了缓存,这个时候就变一致了,只需要确保在下单的时候是用db的数据即可。
(13)读多写多的情况
如果是读多写多,又要保证缓存数据库一致性,怎么办?
对读多写多的场景,就不应该用缓存,直接操作数据库就好了,对吧。
也有方法既使用缓存,又应对读多写多的场景,中间件canal。后面就学不着了,需要报课。。。。以后再看看