HDFS概念与设计

2020-09-22  本文已影响0人  雁阵惊寒_zhn

数据块

HDFS上的文件可能被划分到多个数据块上存储,默认每一个数据块的大小是128M,小于一个块大小的文件不会占据整个块的空间。

HDFS数据块大小的调整会产生什么影响?

HDFS设置大块,可以最小化寻址开销。如果数据块足够大,磁盘上数据的传输时间会明显大于寻址的时间。但是也不应该设置的过大,这是因为MapReduce中map任务通常一次只处理一个数据块中的数据,如果任务数量很少,例如少于集群节点数量,作业的运行速度就会比较慢。

分块的好处

  1. 文件的大小可以很大,文件的所有块不需要存储在同一个磁盘上;
  2. 抽象的数据块而不是整个文件作为存储单元,简化存储系统的设计;
  3. 数据块为单位还适合数据的备份,例如HDFS对数据库进行备份,默认为3。

namenode和datanode

管理节点-工作节点模式

namenode

datanode

上一篇 下一篇

猜你喜欢

热点阅读