尺有所短，寸有所长：CAP和数据存储技术选择

2020-11-26 本文已影响0人码农架构

理解概念

CAP 理论，又叫做布鲁尔理论（Brewer’s Theorem），指的是在一个共享数据的分布式存储系统中，下面三者最多只能同时保证二者，对这三者简单描述如下：

保持一致性:

image.png

发生分区:

如果写入并返回成功，满足系统的可用性，就意味着丢失了数据一致性。因为节点 A 的数据是最新的，而节点 B 的数据是过期的。
如果不写入数据，而直接返回失败，即节点 A 拒绝写操作，那么 A 和 B 节点上的数据依然满足一致性（写入失败，但依然都是相互一致的老数据），但是整个系统失去了可用性。

image.png

CAP 的应用似乎就是一个三选二的选择题，但事实上，完全不是这样的。

需要特别说明的是，这里说的是只能“保证”一致性和可用性二者之一，而不是说，在系统正常运行时，二者不可能“同时满足”。在系统运行正常的时候，网络分区没有出现，那么技术上我们是可能同时满足一致性和可用性两者的。

是否存在 CA 系统?

有！但请注意，那其实已经不是 CAP 理论关心的对象了，因为 CAP 要求的是节点间的数据交换和数据共享。任何时候都不会有分区发生，这种系统基本上有这样两种形式：

它被设计出来的目的，并非要取代关系数据库，而是成为关系数据库的补充，即“Not Only SQL”。

我们可以利用 CAP 定理来权衡和帮助选择合适的存储技术，且看下面这张 NoSQL 系统的 CAP 三角形

image.png

从特性上说，甚至可以部分特性做到 CP，部分做到 AP，这都是有可能的。

公众号：码农架构