缓存之数据一致性与更新策略

2021-05-28 本文已影响0人冰河winner

1、为什么需要缓存

一般在项目中，最消耗性能的地方就是后端服务的数据库了。而数据库的读写频率常常都是不均匀分布的，大多情况是读多写少，并且读操作还会有一些复杂的判断条件，比如 like、group、join 等等，这些语法是非常消耗性能，因此数据库很容易在读操作的环节遇到瓶颈。

那么通过给数据库加一个前置缓存，就可以有效的吸收不均匀的请求，抵挡流量波峰。

另外，如果应用与数据源不在同一个服务器的情况下，中间还会有很多的网络消耗，也会对应用的响应速度有很大影响，如果当前应用对数据实时性的要求不那么强的话，在应用侧加上缓存就能很快速的提升效率。

2、更新策略

既然是缓存，就意味着缓存中暂存的数据只是个副本，相当于把数据存放了2份，一份是在数据库中，另一份存放在缓存中。当有新的数据要写入或者旧数据需要更新的时候，如果我们只更新了其中一份数据源，那两边的数据就不一致。所以使用缓存必然要面对一个问题：缓存数据与数据库数据如何进行有效且快速的同步。

一般来说，缓存的更新策略有以下三种模式：

Cache Aside 更新模式：同时更新缓存和数据库
Read/Write Through 更新模式：先更新缓存，缓存负责同步更新数据库
Write Behind Caching 更新模式：先更新缓存，缓存定时异步更新数据库

2.1 Cache Aside更新模式

失效：应用程序先从 cache 取数据，没有得到，则从数据库中取数据，成功后，放到缓存中。
命中：应用程序从 cache 中取数据，取到后返回。
更新：先把数据存到数据库中，成功后，再去删除缓存或者让缓存失效。

1.png

这种策略下，在并发写的时候可能会出现脏数据的问题。

2.2 Read/Write Through 更新模式

应用程序只需要维护缓存，数据库的维护工作由缓存代理：

2.png

2.2.1 Read Through

Read Through 模式就是在查询操作中更新缓存，也就是说，当缓存失效的时候，Cache Aside 模式是由调用方负责把数据加载入缓存，而 Read Through 则用缓存服务自己来加载。

2.2.2 Write Through

Write Through 模式和 Read Through 相仿，不过是在更新数据时发生。当有数据更新的时候，如果没有命中缓存，直接更新数据库，然后返回。如果命中了缓存，则更新缓存，然后由缓存自己更新数据库（这是一个同步操作）

2.3 Write Behind Caching 更新模式

Write Behind Caching 更新模式就是在更新数据的时候，只更新缓存，不更新数据库，而我们的缓存会异步地批量更新数据库。这个设计的好处就是直接操作内存速度快。因为异步，Write Behind Caching 更新模式还可以合并对同一个数据的多次操作到数据库，所以性能的提高是相当可观的。

3.png

但其带来的问题是，数据不是强一致性的，而且可能会丢失。另外，Write Behind Caching 更新模式实现逻辑比较复杂，因为它需要确认有哪些数据是被更新了的，哪些数据需要刷到持久层上。只有在缓存需要失效的时候，才会把它真正持久起来。

3、场景推演

以上的理论知识准备完毕，下面来用具体场景推演一下缓存更新的细节问题。

理论是美好的，现实是残酷的，现实最终会把“美好的”的理论变成“没好的”，不信走着瞧。

缓存怎么更新，在实际应用中有很多种骚操作，但是归根结底来说，就是当数据发生变化时如何考虑以下两个问题：

对缓存是删除，还是更新？
先操作数据库，还是先操作缓存？

组合起来有以下四种方案。

3.1 先更新数据库，后更新缓存

第一种场景：更新数据库成功，更新缓存失败，则出现缓存与数据库不一致。

第二种场景：请求A更新值为99，请求B更新值为98。

4.png

请求A先发起，更新数据库为99，但还没有来得及更新缓存
请求B发起，更新数据库为98，又更新了缓存值为98
请求A这时才更新缓存的值为99

这样数据库的值为98，但缓存的值为99，数据一致出现了。

3.2 先更新缓存，后更新数据库

第一种场景：更新缓存成功，更新数据库失败，则出现缓存与数据库不一致。

第二种场景：与上面的流程类似，出现的问题也很类似。

请求A先更新缓存为99，但还没有来得及更新数据库
请求B更新缓存为98，又更新了数据库为98
请求A这时更新数据库为99

这样就缓存的值为98，数据库为99导致不一致。

3.3 先删除缓存，后更新数据库

第一种场景：删除缓存成功，更新数据库失败，则缓存与数据库不一致，但这种不一致会马上被修正，因而影响不大，因为下一次请求缓存的时候发现缓存中没有，会从数据库重新加载。但是又有一个问题出现了，在旧的缓存被删除后，新的缓存未写入之前，这段时间内如果有读操作，那么旧的值会被重新加载到缓存，这就相当于没更新缓存。

第二种场景：请求A更新值为99，请求B获取值。

5.png

请求A更新值，先把缓存中的值删除，但还没有来得及更新数据库
此时请求B过来查询此值，发现缓存中不存在，就到数据库中查询
请求B在数据库中获取到值，在把值设置到缓存中
请求A这时才更新数据库里面的值为99

这样就导致了缓存和数据库的不一致问题，缓存中的值一直是旧数据。

3.4 先更新数据库，后删除缓存

第一种场景：更新数据成功，删除缓存失败，则出现缓存与数据库不一致。

第二种场景：请求A查询值，请求B更新值。

6.png

请求A发起查询请求，直接到数据库查询到100，但还没有来得及去设置缓存
请求B更新值，先更新数据库，在删除缓存
请求A这时才设置缓存为100

3.5 总结

推演完毕。

结果发现，没有一个方案走得通，这还怎么玩？这么一看，现实不只把理论给打残了，而且是按在地上摩擦啊！

通过上面的推演，可以发现每种方案都有两种问题：

（1）第一种问题：操作的原子性无法保证

对数据库与缓存的操作是分两步操作的，并没有类似数据库事务那样的控制，一旦第一步成功，第二步失败，必然导致数据不一致。

（2）第二种问题：并发请求导致数据覆盖

并发环境下，多个请求的处理顺序无法保证，会导致旧数据覆盖掉新数据的情况。但是，不是说并发一定导致数据覆盖，这是一个概率问题，如何将概率降至最低，或者降为零（比如加锁），需要我们根据具体的业务场景来分析。

但是，任何脱离实际业务的推演都是耍流氓。

下面来一个个的分析。

3.5.1 先更新数据库，后更新缓存

相对来讲，理论上这种方式比“先更新数据库，再删缓存”有着更高的读性能，因为它事先在缓存中准备好了数据。

但是缺点也很明显：

如果是一个写多读少的场景，采用这种方案就会导致，可能更新了十次缓存，但是就读了一次，其余九次的更新是没必要的，浪费性能。
如果你写入数据库的值，并不是直接写入缓存的，而是要经过一系列复杂的计算再写入缓存。那么，每次写入数据库后都再次计算写入缓存的值，同样是浪费性能的，这种情况下显然删除缓存更为适合。

那更新缓存与删除缓存呢到底哪种更好呢？实际上主要取决于“更新缓存的复杂度”。

如果更新缓存的代价很小，一般应该更倾向于更新缓存，以保证更高的缓存命中率。
如果缓存是通过很复杂的数据计算得出来的，更新缓存的代价很大，一般更倾向于删除缓存。

3.5.2 先更新缓存，后更新数据库

既然我们把缓存当做副本，所有数据必须要以数据库为准。“先更新缓存，后更新数据库”可能导致的“缓存有数据，而数据库没数据”，是绝对不能容忍的，所以该方案在实际业务当中基本没法用。

3.5.3 先删除缓存，后更新数据库

该方案会导致的不一致可以依靠“延时双删策略”解决。

先淘汰缓存
再写数据库（这两步和原来一样）
休眠1秒，再次淘汰缓存

这么做，可以将1秒内所造成的缓存脏数据，再次删除。

第1个问题：这个1秒怎么确定的，具体该休眠多久呢？

需要根据读数据业务逻辑的耗时综合判断。然后写数据的休眠时间则在读数据业务逻辑的耗时基础上，加几百ms即可。这么做的目的，就是确保读请求结束，写请求可以删除读请求造成的缓存脏数据。

第2个问题：采用这种同步淘汰策略，吞吐量降低怎么办？

将第二次删除作为异步的。自己起一个线程，异步删除。这样，写请求就不用休眠一段时间后再返回了，可以加大吞吐量。

第3个问题：第二次删除如果失败了怎么办？

如果对缓存的准确性要求不高，可以依靠MQ消息的重试或者定时任务来兜底。

3.5.4 先更新数据库，后删除缓存

这种方案时在实际业务当中是使用率最高的。原因有两点：

先更新数据库，首先保证了数据源头一定是正确的。
并发导致的数据不一致，概率非常低。

回头看看上面的场景，如果发生不一致，需要具备以下四个条件：

读操作时，缓存恰好失效
有个并发的写操作
写操作比读操作更快
读操作早于写操作进入数据库，晚于写操作更新缓存

而实际上数据库的写操作普遍比读操作慢得多，而且可能还要锁行、锁表。而读操作必需在写操作前进入数据库操作，而又要晚于写操作更新缓存，所有的这些条件都具备的概率基本并不大。并且即使出现这个问题，还可以设置缓存过期时间来自动兜底。

但是该方案还有个问题要解决，第二步删除缓存失败怎么办？

答案是提供一个重试机制即可，比如MQ：

7.png

更新数据库数据；
缓存因为种种问题删除失败
将需要删除的key发送至消息队列
自己消费消息，获得需要删除的key
继续重试删除操作，直到成功

然而，该方案有一个缺点，对业务线代码造成大量的侵入。于是有了方案二，在方案二中，启动一个订阅程序去订阅数据库的binlog，获得需要操作的数据。在应用程序中，另起一段程序，获得这个订阅程序传来的信息，进行删除缓存操作。

8.png

更新数据库数据
数据库会将操作信息写入binlog日志当中
订阅程序提取出所需要的数据以及key
另起一段非业务代码，获得该信息
尝试删除缓存操作，发现删除失败
将这些信息发送至消息队列
重新从消息队列中获得该数据，重试操作。

3.5.5 总结

方案1：先更新数据库，后更新缓存，最好不用
方案2：先删除缓存，后更新数据库，坚决不用
方案3：先删除缓存，后更新数据库，适度使用
方案4：先更新数据库，后删除缓存，推荐使用

但是也不能盲从，马克思曾经曰过的：具体问题，具体分析。

没有完美的方案，只有合适的方案。

4、主从架构下的问题

上面的各种场景都是只有一个数据库实例的情况，而实际生产过程中往往是一主多从的。

按照写主读从，缓存加载数据的时候应该从从库中读，而本来主从同步就有延迟，于是读从库很有可能读到的是旧数据。

为了解决这种问题，可以考虑以下几种方案：

第一种：强制缓存读主数据库

这样一来，就不必考虑主从同步的问题了，可行。

第二种：选择性地读主数据库

之所以强制读主库，是因为在主从同步完成之前从库中的数据还是旧的，当主从同步完成后再读从库就没什么问题了，那么如果在主从同步的这段时间内如果没有请求读这个KEY就没有问题，如果这段时间内有请求读取这个KEY，那么在同步完成后要删除这个KEY。

如何判断在主从同步这段时间内有没有请求读取这个KEY呢？

在更新数据库的时候，往缓存中设置一个KEY，格式是：缓存KEY+业务数据ID，其生存时间是主从延时时间。在读的时候，首先判断缓存中有没有这样一个KEY，如果有则从主库中重新加载数据到缓存，没有，则直接从从库中加载数据到缓存

第三种：订阅从库的binlog

可以通过工具（比如，canal）订阅从库的binlog，这是比较准确的，从库数据有更新，则立即更新缓存。

缓存之数据一致性与更新策略

1、为什么需要缓存

2、更新策略

2.1 Cache Aside更新模式