大数据技术

大数据技术之HDFS(四)

2021-04-15  本文已影响0人  pauls

HDFS 的 读写流程

4.1 HDFS 写数据流程

4.1.1 剖析文件 写入

写数据

4.1.2 网络拓扑- 节点 距离 计算

在 HDFS 写数据的过程中,NameNode 会选择距离待上传数据最近距离的 DataNode 接收数据。那么这个最近距离怎么计算呢?

节点距离:两个节点到达最近的共同祖先的距离总和。

网络拓扑-节点距离计算

节点距离计算

例如,假设有数据中心 d1 机架 r1 中的节点 n1。该节点可以表示为/d1/r1/n1。利用这种标记,这里给出四种距离描述。

大家算一算每两个节点之间的距离。

4.1.3 机架 感知 (副本 存储 节点 选择)

(1)官方说明

官方说明

(2)源码说明

Crtl + n 查找 BlockPlacementPolicyDefault,在该类中查找 chooseTargetInOrder 方法。

副本节点选择

Hadoop3.1.3副本节点选择

4.2 HDFS 读数据流程

读数据流程
上一篇 下一篇

猜你喜欢

热点阅读