6.824分布式系统[2]-GFS案例学习

2020-02-12  本文已影响0人  唯识相链2

准备工作

阅读:GFS论文

背景

为什么阅读GFS的论文

一致性是什么

理想的一致性模型

分布式文件系统需要达成的“理想的“一致性就是多节点上面操作文件表现处理单机跟本地文件系统一样。

不同的模型一致性考虑不同的权衡

+ 可串行性(serializability)
+ 顺序一致性(sequential consistency)
+ 线性一致性(linearizability)
+ 单项一致性模型(entry consistency)
+ 松散一致性(release consistency)

GFS的目标

设计

客户端读

primary

primary是一个副本节点中比较高级的节点。

修改现有文件

添加文件

失败情况

块服务器的失败会引起client重试。
master失败会导致GFS不可用,shadow master会服务只读的状态。可能会返回过时的数据。

总结

性能,容错,一致性(performance, fault-tolerance, consistency)的案例研究

GFS案例问答

为什么添加数据执行至少一次"at-least-once"语义,而不是精准的一次?

实现困难,primary需要保留重复的状态。状态必须在服务器之间复制,以便如果primary出现故障, 此信息不会丢失。

应用程序如何知道块的哪些是有数据的块,哪些是重复的数据

可以在有效记录的开头做标识(magic number)就可以知道有数据的块。
检测重复的块可以为每个记录都有一个特殊的UID标识。

论文中提到的reference counts是什么意思

参考资料

上一篇下一篇

猜你喜欢

热点阅读