HDFS架构简介

2020-05-18  本文已影响0人  ArthurIsUsed

Hadoop特点

Hadoop 2.0时期的架构图

Hadoop的核心组件: HDFS(分布式文件系统)、MapReduce(分布式编程框架)、YARN(运算资源调度系统)


HDFS组成

HDFS特点

优点

缺点

HDFS组件

HDFS 采用Master/Slave的架构来存储数据,这种架构主要由四个部分组成,分别为HDFS Client、NameNode、DataNode和Secondary NameNode。

NameNode

DataNode

Secondary NameNode

Secondary NameNode 的作用就是定期合并 fsimage 和 edits 日志,将 edits 日志文件大小控制在一个限度下。
       ● 当满足一定的条件时Secondary NameNode会采用Http get从NameNode下载edits和fsimage文件。
       ● 下载文件前,NameNode会重新生成edits.new,让后续的操作信息都存到这个新的edits文件当中。
       ● Secondary NameNode将这两个文件加载到内存并进行合并,生成新的fsimage.ckpt。
       ● 将fsimage.ckpt推送给NameNode,NameNode去掉fsimage.ckpt的后缀去掉,改成fsimage。
       ● 等到fsimage新的文件替换掉旧的fsimage的时候,旧的edits文件才会被新的edits文件所替换。
       ● 替换fsimage跟edits的过程称为一个检查 点 (checkpoint)。


HDFS读文件

HDFS写文件

HDFS启动

[root@itcast01 ~]# cd /usr/local/hadoop-2.9.1/sbin
[root@itcast01 sbin]#   ../bin/hdfs namenode -format
[root@itcast01 sbin]#  ./start-dfs.sh,    

#启动之后可以看到三个java进程: NameNode、SecondaryNameNode、DataNode

[root@itcast01 sbin]# jps
3369 Jps
2918 NameNode
3266 SecondaryNameNode
3008 DataNode
[root@itcast01 sbin]# 

参考资料

https://blog.csdn.net/u012453843/article/details/52463165
https://www.cnblogs.com/wujing-hubei/p/6005354.html
https://www.cnblogs.com/codeOfLife/p/5375120.html
http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html

上一篇下一篇

猜你喜欢

热点阅读