缓存穿透、缓存雪崩、缓存击穿
2019-04-03 本文已影响0人
zyqcoder
缓存穿透
缓存穿透的意思是查询一个一定不存在的数据,因为缓存中没有这个信息,则会去数据库查询,从系统层面来看就像穿透了缓存层,直接到达db进行查询,从而称为缓存穿透。失去了缓存层的保护,这种查询一定不存在的数据对系统来说是很危险的,如果有人恶意通过这种方式不停的请求数据库,会对数据库造成压力甚至会导致系统崩溃。
解决方案:
- bloom filter: 类似哈希表的一种算法,用所有可能的查询条件生成一个bitmap,在进行数据查询的时候,先用这个bitmap进行过滤,如果不存在其中,就直接过滤,从而减轻数据库层面的压力。Guava中有实现BloomFilter的算法。
- 空值缓存:一种比较简单的解决方法,在第一次查询完不存在的数据后,将key和空值也缓存起来,并设置较短的失效时间,例如60s。这样则可以避免短时间的大量该key的攻击,设置较短时间的失效时间是因为该值可能与业务无关,存在的意义不大,且该次查询未必是攻击者发起,无过久存储的必要。
缓存雪崩
在普通的缓存系统中,一般例如redis、memcache等中,我们会给缓存设置一个失效时间,如果这些缓存的失效时间集中在相同时刻,那么在同一时间失效时,所有的系统请求都会发送到数据库层,db可能无法承受如此大的压力导致系统崩溃。
解决方案:
- 线程互斥:只让一个线程构建缓存,其他的线程等待缓存构建完毕直接从缓存中拿数据,这个时刻只有一个线程在执行请求,减轻了db的压力,但缺点也很明显,降低了系统的qps。
- 交错失效的时间:这是一个比较简单粗暴的方法,既然同一时间失效会对db产生相当大的压力,那么我们就错开缓存失效的时间,在相对合理的区间内设置随机的失效时间即可。
缓存击穿
缓存击穿其实是缓存雪崩的一个特例,在查询数据时,缓存中没有,但是数据库中有,此时大量请求全部发到数据库中,给数据库带来极大的压力。击穿与雪崩之间的区别在于击穿是对于某一特定的热点数据来说,而雪崩是全部数据。