笔记本📒

HDFS读写流程

2020-03-02  本文已影响0人  涓涓自然卷

闲暇之余,梳理了一下HDFS的读、写数据流程。

(一)下图是HDFS读数据流程图:
HDFS读数据流程.png

在这里:
①文件名为/aa/...txt,
②每个数据块有3个副本,
③共有BLK_1、BLK_2、BLK_3三个数据块组成,
④BLK_1存储在DN1、DN3、DN4节点上,BLK_2存储在DN1、DN4、DN5节点上,BLK_3存储在DN2、DN3、DN5节点上。

这里选择节点遵循就近原则,然后随机。

(二)下图是HDFS写数据流程图:
HDFS写数据流程.png

在这里,考虑因素:空间和距离
DataNode选择策略:
①第一个副本先考虑与client最近的(同机架)
②第二个副本再考虑跨机架挑选一个datanode,增加副本可靠性
③第三个副本在第一个副本同机架另外挑选一台datanode存放
配置机架感知,知道哪个datanode放在哪个机架。

在这里,block一个上传成功就算成功了,之后NameNode会做一步同步操作。

上一篇下一篇

猜你喜欢

热点阅读