老徐和阿珍的故事:CAP是什么?超级爱放P吗?
人物背景:
老徐,男,本名<u>徐福贵</u>,从事Java相关研发工作多年,职场老油条,摸鱼小能手,虽然岁数不大但长的比较着急,人称老徐。据说之前炒某币败光了所有家产,甚至现在还有欠债。
阿珍,女,本名<u>陈家珍</u>,刚刚入职不久的实习生,虽然是职场菜鸟但聪明好学。据说是学校的四大校花之一,追求她的人从旺角排到了铜锣湾,不过至今还单身。
阿珍吃完饭刚刚回来,看到老徐正在吃方便面,说:“老徐,不至于吧。你为了还债,中午就吃这个呀?”
老徐不慌不忙地嚼着方便面,说:“这可是白象的方便面,国货之光,超级难买,我好不容易才买到的。”
阿珍坐了下来,说:“闻着还挺香,我也买点尝尝。对了,老徐,上午开会的时候,听你们总说CAP、CAP的,CAP是什么意思?超级爱放P吗?”
老徐嘴里方便面差点喷了出来,笑着说:“第一次听你这么解释的,来!我给你科普一下。”
CAP 是加州大学伯克利分校(University of California at Berkeley)的计算机教授
埃里克·布鲁尔(Eric A. Brewer)在2000年的分布式计算原理研讨会(PODC,Symposium on Principles of Distributed Computing)上提出的一个猜想。
2002 年,麻省理工学院(MIT,Massachusetts Institute of Technology)的赛斯·吉尔伯特(Seth Gilbert)和南希·林奇(Nancy Lynch)发表了对这个猜想的证明,使之成为分布式计算领域公认的一个定理。
Seth Gilbert@万猫学社 Nancy Lynch@万猫学社CAP定理是指在一个互相连接并共享数据的节点的分布式系统中,当涉及读写操作时,只能保证一致性(Consistence)、可用性(Availability)、分区容错性(Partition Tolerance)三者中的两个,另外一个必须被牺牲。
CAP,是Consistence、Availability、Partition三个英文单词的首字母缩写。
其中,一致性是指对某个指定的客户端来说,读操作保证能够返回最新的写操作结果;可用性是指非故障的节点在合理的时间内返回不是错误和超时的合理响应。分区容忍性是指当出现网络分区后,系统能够继续运行。
因为网络本身无法做到100%可靠,有可能出故障,分区是一个必然的现象,所以我们必须选择分区容忍性(P)。在分布式系统中不可能选择CA(一致性和可用性),只能选择CP(一致性和分区容错性)或者AP(可用性和分区容错性)。
当选择CP时,发生分区现象后,为了保证数据的一致性,客户端访问任意节点都会被返回错误,所以不能满足可用性,比如ZooKeeper。
当选择AP时,发生分区现象后,为了保证节点的可用性,客户端可以访问某个节点上可能过时的数据,所以不能满足一致性,比如Eureka。
阿珍用手捂着嘴打了一个哈欠,眨了眨还有泪花的眼睛,说:“这理论性也太强了吧,还是说说你的白象方便面在哪买的吧。”