《分布式技术原理与算法解析》学习笔记Day20

2023-02-22 本文已影响0人技术修行者

CAP理论

什么是CAP理论？

CAP理论用来指导分布式系统设计，以保证系统的可用性、数据一致性等。

C，Consistency，一致性，指所有节点在同一时刻的数据是相同的，即更新操作执行结束并响应用户完成后，所有节点存储的数据会保持相同。
A，Availability，可用性，指系统提供的服务一直处于可用状态，对于用户的请求可即时响应。
P，Partition Tolerance，分区容错性，指在分布式系统遇到网络分区的情况下，仍然可以响应用户的请求。网络分区是指因为网络故障导致网络不连通，不同节点分布在不同的子网络中，各个子网络内网络正常。

一致性、可用性和分区容错性是分布式系统的三个特征。

CAP理论是指在分布式系统中，C、A、P这三个特征不能同时满足，只能满足其中两个。

如何平衡C、A和P？

在实际场景中，网络环境不可能百分百不出故障，比如网络拥塞、网卡故障等，都会导致网络故障或者不通，从而导致节点之间无法通信，或者集群中节点被划分成多个分区，分区中的节点之间可以通信，但是分区之间是不能通信的。

这种由网络故障导致的集群分区情况，被称为网络分区。

保证一致性C和可用性A（CA）

在分布式系统中，现有的网络基础设施无法做到始终保持稳定，网络分区难以避免，牺牲分区容错性P，就相当于放弃部分分布式系统，因此在分布式系统中，是不需要考虑CA模式的。

但是在单点系统或者单机系统中，CA需求是可以满足的，例如大部分关系型数据库，如果部署在单台机器上，因为不存在网络通信，所以是可以保证CA的。

保证一致性C和分区容错性P（CP）

如果一个分布式场景需要很强的数据一致性，或者该场景可以容忍系统长时间没有响应，那么放弃可用性A，保留一致性C是比较合适的。

一个保证CP的分布式系统，一旦发生网络分区会导致数据无法同步的情况，这时需要牺牲系统的可用性，降低用户体验，直到节点数据达到一致后再提供服务。

一般涉及到金融相关的场景，在任何时候都需要保证强一致，因此要保证CP。

保证CP的系统包括Redis、HBase、ZooKeeper等。

例如，ZooKeeper集群包括Leader节点和Follower节点，Leader节点专门负责处理用户的写请求：

当用户向节点发送写请求时，如果请求的节点是Leader，那么直接处理请求。
如果请求的节点是Follower，那么该节点会将请求转给Leader，然后Leader会向所有的Follower发出一个Proposal，等超过一半的节点统一后，Leader才会提交这次写操作，从而保证数据的强一致性。

当ZooKeeper集群中出现网络分区，如果其中一个分区的节点数大于集群节点数的一半，那么这个分区可以再选出一个Leader，仍然对外提供服务，但是在选出Leader之前，系统是不可用的；如果形成的分区中，没有一个分区的节点数大于集群节点总数的一半，那么系统不能正常对外提供服务，必须等待网络恢复后，才能正常提供服务。

保证可用性A和分区容错性P（AP）

如果一个分布式系统需要很高的可用性，或者说在网络状况不好的情况下，允许数据暂时不一致，那么可以牺牲一定的一致性。

这时网络分区出现后，各节点之间的数据无法马上同步，为了保证高可用，分布式系统需要即刻响应用户请求，但此时某些节点还没有拿到最新数据，只能将本地旧的数据返回给用户，从而产生数据不一致的情况。

适合AP的场景有很多，例如查询网站、电商中的商品查询等，这样的系统用户体验更加重要，需要保证系统的可用性。

保证AP的系统包括CoachDB、Eureka、Cassandra、DynamoDB等。

下面是关于CA、CP和AP的详细比较。

20-CAP比较.png

CAP和ACID

ACID是数据库事务中常见的理论，它和CAP是两回事：

ACID中的A是指“原子性”，强调事务要么执行成功，要么执行失败；CAP中的A是指“可用性”，表示系统提供的服务一直处于可用状态，可以响应用户的请求。
ACID中的C是指事务执行前后，数据的完整性保持一致或者满足完整性约束；CAP中的C强调的是数据一致性，集群中各节点之间通过复制技术保证数据在任意时刻都是相同的。