分布式架构设计之数据层

2019-06-09 本文已影响0人机智的老刘明同志

数据层：

缓存：

缓存穿透（注：如果从存储层查不到数据则不写入缓存，这将导致这个不存在的数据每次请求都要到存储层去查询，失去了缓存的意义。在流量大时，可能DB就会挂掉）

方案1 布隆过滤器（bloomfilter）（注：布隆过滤器可检索一个元素是否在一个集合中。优点：空间效率和查询时间都比一般的算法要好的多，缺点：有一定的误识别率和删除困难。）

方案2 缓存 NULL（注：不管是数据不存在，还是系统故障。我们仍然把这个空结果进行缓存，但它的过期时间会很短，最长不超过五分钟）

缓存雪崩（key集体过期）

方案1 缓存失效时间增加小随机数，避免集体失效

方案2 永不过期，旁路进程扫描替换过期数据

缓存击穿（单热点key 注：缓存在某个时间点过期的时候，恰好在这个时间点对这个Key有大量的并发请求过来，这些请求发现缓存过期一般都会从后端DB加载数据并回设到缓存，这个时候大并发的请求可能会瞬间把后端DB压垮。）

方案1 分散热点key为多个子key，对应相同的value存储在不同服务器上，分散单机压力 （注：hystrix，可以做资源的隔离保护主线程池，把这个应用到缓存的构建也未尝不可）

方案2 （针对单机的多进程）单进程更新缓存，加分布式锁，其他进程等待，避免数据过期时恰有大量的并发请求压向存储系统；（注：分布式锁如reids setnx 确保一个时间段内只有一个进程访问db更新）

方案3 （针对单机的多进程）“提前”使用互斥锁：内部超时时间（小于实际超时时间）一到，马上更新超时时间（其他进程则认为没过期）并加载db缓存。（注：在value内部设置1个超时值(timeout1), timeout1比实际的memcache timeout(timeout2)小。当从cache读取到timeout1发现它已经过期时候，马上延长timeout1并重新设置到cache。然后再从数据库加载数据并设置到cache中）

方案4: 永不过期 （注：1.redis永不过期 2 如果发现要过期了，通过一个后台的异步线程进行缓存的构建，也就是“逻辑”过期）

本地缓存中间件：guava cache（Google开源）

服务端缓存中间件：memcached、redis、Tair（淘宝开源分布式kv缓存系统）

一致性：

CAP原则

分布式锁

数据库分布式锁：简单易理解；单点、性能差、不可重入。（注：乐观锁，悲观锁，mvcc）

缓存分布式锁：非阻塞性能好；复杂容易死锁。（注：Memcached 可以使用 add 命令，该命令只有KEY不存在时，才进行添加，或者不会处理。Memcached 所有命令都是原子性的，并发下add 同一个KEY ，只会一个会成功）

Zookeeper分布式锁：通过有序临时节点实现锁机制。（注①）

redis分布式锁：基于setnx(set if not exists)，单进程单线程模式不用加锁。

一致性算法

Paxos

Zab（Zookeeper中的分布式一致性算法）

Raft（etcd使用raft协议）：正确高效简洁。通过随机等待的方式发出投票，的票多者获胜。

Gossip

幂等（重复调用的结果相同） 常见手段：悲观锁、乐观锁、唯一索引、一次性token、序列号等。（注：这里秒数可能抽象，举个例子：姓名和电话的组合在mysql中不能重复，我们可以新建一个唯一索引，对姓名和电话拼接成的字符串进行md5加密）

主从架构

一般主从系统都会选择强一致协议，即主节点采用将数据发送给从节点收到响应成功后，才会将数据持久化到本地，返回用户成功。

单点问题（应尽量减少与单点的交互。两种常见方法：批量写和客户端缓存。）

双主架构：

1.一台主库(我们称之为master-01)提供服务，只负责数据的写入；

2.拿出一台数据库服务器(我们称之为master-02)资源做master-01主库的从库(之间做主从同步)；

3.两台主库之间做高可用,可以采用keepalived等方案(一定要保证master-01同时也要作为keepalived的主)

4.程序在调用主库IP地址的地方写为高可用的VIP地址；

5.所有提供服务的从服务器与master-02进行主从同步；

6.建议采用高可用策略的时候，当master-01出现问题切换到master-02的时候，即使master-01恢复了，也不要让它去自动承接VIP地址，否则可能造成数据的混写；

影子master架构：

shadow-master是一种很常见的解决单点高可用问题的技术方案。业内经常使用keepalived+vip的方式实现这类单点的高可用）

中心调度节点通常直接用zookeeper消灭单点。

去中心化架构（略）

Quorum协议，多数派原则。

唯一ID生成：

核心思想是结合服务/机器、时间、随机数来组合生成UUID。

一致性hash：

确保在缓存服务器节点数量发生变化时大部分数据保持原地不动。

数据库扩展

通常mysql单库5千万条需要分库（最好能拆分到1千万以内）。

问题：事务、Join、数据迁移、容量规划和扩容、ID路由、分页等。

分库分表中间件：sharding-jdbc(当当)、Tsharding(蘑菇街)、Atlas(奇虎360)、MyCAT(阿里)、Vitess(Google)等