并发环境下，先操作数据库还是先操作缓存？ - 哈喽比特

925次阅读 | 发布于4年以前

前言

在分布式系统中，缓存和数据库同时存在时，如果有写操作，先操作数据库还是先操作缓存呢？本文将分5种方案展开阐述对比，谢谢阅读~

github地址，衷心感谢每一颗star

❝https://github.com/whx123/JavaHome

❞

如果是一读（线程B）一写（线程A）操作，「先操作缓存，再操作数据库」。流程图如下所示：

「这样看，没啥问题」。我们再看第二个流程图，如下：

OK，酱紫，就有问题了吧，老数据入到缓存了，「每次读都是老数据啦，缓存与数据与数据库数据不一致了」。

上个方案是一读一写，如果是双写操作，「先操作缓存，在操作数据库」，会怎么样呢？

「这样看，也没啥问题。」，但是有时候可能事与愿违，我们再看第二个流程图，如下:

执行完后，缓存保存的是B操作后的数据，数据库是A操作后的数据，「缓存和数据库数据不一致了」。

一写（线程A）一读（线程B）操作，「先操作数据库，再操作缓存」。

有些朋友可能认为，在第2步删除缓存之前，线程B读过来呢？这时候，读到的是缓存老数据，这个可以认为是正常业务逻辑呀，下次再读取就是正确数据了。

这种方案「没有明显的并发问题」，但是呢，「步骤二删除缓存失败」，还是个问题。不过概率比较小，「优于方案一和方案二」，平时工作中也是使用方案三。

综上对比，我们一般采用方案三，但是有没有完美全解决方案三的弊端的方法呢？

这个是方案三的改进方案，都是先操作数据库再操作缓存，我们来看一下流程图：

通过数据库的「binlog」来「异步淘汰key」，以mysql为例可以「使用阿里的canal将binlog日志采集发送到MQ队列」里面，然后「通过ACK机制确认处理」 这条更新消息，删除缓存，保证数据缓存一致性。

但是呢还有个问题，「如果是主从数据库呢」？

主从DB问题：因为主从DB同步存在延时时间。如果删除缓存之后，数据同步到备库之前已经有请求过来时，「会从备库中读到脏数据」，如何解决呢？解决方案如下流程图：

综上所述，在分布式系统中，缓存和数据库同时存在时，如果有写操作的时候，「先操作数据库，再操作缓存」。如下：