HDFS Block

2019-08-14 本文已影响0人天之見證

1.为什么hdfs上文件的存储不用原始文件,而使用block

由于hadoop中存储的的数据更多的应用场景是全量读取, 所以更大的块有更高的读取速度

例如: seekTime: 10ms, transfer rate: 100MB/s

block 大小	个数	读取耗时(s)
100MB	1	100MB/100MB/s + 10ms = 1.01s
10MB	10	(10MB/100MB/s + 10ms) * 10 = 1.1s

从上可以看出较大的block块有更好的读取性能 (seekTime不会因为block的大小而受到影响)

hdfs fsck / -files -blocks

client_read_file.png

从上图可以看出通过FDDataInputStream 屏蔽掉了具体底层的block, 如果是多个block的话,读完一个之后将关闭和datanode的链接,并和另一个datanode建立连接开始读取它上面的block

DFSInputStream 和 datanode通信发生错误时 (此时不论datanode出了什么问题, 可能是宕机了), DFSInputStream 将重试含有该block的其他datanode,从其上读取数据, 并将上次错误datanode记录下来以防无限重试

client_write_file.png

同样的写文件的时候hdfs通过DFSOutputStream来屏蔽掉了具体的细节

写数据的时候是DFSOutputStream 会将要写的数据切分成多个packet, 将其写入data queue , DataStreamer 来消费这个队列,伴随着向namenode申请block地址, 并由datanode自己去完成副本的建立

DFSOutputStream 同时维护一个ack queue 用来判断哪些packet已经同步好了

当一个datanode宕掉的时候 (副本为3)

block: hdfs存储的最小单位

chunk: block被切成了一个个的chunk,并且每个都有一个checksum

packet: 一组用于传输的chunk, 包含一个header, 多个checksum和多个数据内容

ref: