双十一某电商缓存雪崩的三个层次的完美解决方案

2020-11-18 本文已影响0人 sknfie

概述

由于缓存集群出现故障，导致大量请求访问后端服务，可能 mysql 扛不住高并发而打死，像滚雪球一样，影响越来越大，最后导致整个网站崩溃不可用。

缓存雪崩

层次一：事前解决方案

在发生缓存雪崩故障之前，从整体架构上考虑怎么避免 redis 彻底挂掉：

1. redis本身的高可用性、复制、主从架构，操作主节点，读写，数据同步到从节点，一旦主节点挂掉，从节点跟上。
1. 双机房部署，一套 redis cluster，部分机器在一个机房，另一部分机器在另外一个机房。
1. 还有一种部署方式，两套 redis cluster，两套 redis cluster 之间做一个数据的同步，redis 集群是可以搭建成树状的结构的。
  这样的话，一旦某个机房出了故障，另外一个机房还能有些 redis 实例提供服务。

层次二：事中解决方案

redis cluster 已经彻底崩溃了，已经开始大量的访问无法访问到 redis 了。本地缓存

1. ehcache 本地缓存

所做的多级缓存架构的作用上了，ehcache 的缓存应对零散的 redis 中数据被清除掉的现象，另外一个主要是预防 redis 彻底崩溃

多台机器上部署的缓存服务实例的内存中，还有一套 ehcache 的缓存，还能支撑一阵

2. 对 redis 访问的资源隔离

对 redis 访问使用 hystrix 进行隔离，防止自己资源大量阻塞在访问 redis 上

3.对源服务访问的限流以及资源隔离

同上，防止自己资源大量阻塞在访问源服务上，同时 hystrix 在资源隔离时也做到了限流。

层次三：事后解决方案

redis 数据可以恢复，之前讲解过各种备份机制，redis 数据备份和恢复，redis 重新启动起来
redis 数据彻底丢失了或者数据过旧，快速缓存预热，redis 重新启动起来

由于事中做了限流与隔离，缓存服务不会被打死，通过熔断策略和 half-open 策略，可以自动可以恢复对 redis 的访问，发现 redis 可以访问了，就自动恢复了。

小结

基于 hystrix 的高可用服务这块技术之后，先解决缓存服务如何设计成高可用的架构。缓存架构应对高并发下的缓存雪崩的解决方案，是基于 hystrix 去做缓存服务的保护。
基于 hystrix 对 redis 的访问进行保护，对源服务的访问进行保护， hystrix 对源服务的访问进行这种高可用的保护。
但是站的角度不同，源服务如果自己本身不知道什么原因出了故障，就没办法去保护，调用商品服务的接口大量的报错、超时。
总的来说就是：限流、资源隔离、降级保证缓存服务不能死掉，同时快速恢复 redis cluster。

双十一某电商缓存雪崩的三个层次的完美解决方案

概述

层次一：事前解决方案

层次二：事中解决方案

1. ehcache 本地缓存

2. 对 redis 访问的资源隔离

3.对源服务访问的限流以及资源隔离

层次三：事后解决方案

小结

猜你喜欢

热点阅读

双十一某电商缓存雪崩的三个层次的完美解决方案

概述

层次一： 事前解决方案

层次二：事中解决方案

1. ehcache 本地缓存

2. 对 redis 访问的资源隔离

3.对源服务访问的限流以及资源隔离

层次三：事后解决方案

小结

猜你喜欢

热点阅读

层次一：事前解决方案