hadoop中高可用HA的HDFS的架构分析

2019-09-29  本文已影响0人  alexlee666

一、Hadoop组成


二、高可用的HDFS组成

HDFS采用主从结构,Active NameNode和Standby NameNode,是一种高可用HA的设计,两个节点内存中的metadata是同步的(即一致),因此可以保证当前者出错时,后者能够马上顶上,即:

基于高可用HA的HDFS包含组件:

【接下来从功能和处理性能角度分析为何需要👆这些组件:】


2.1 DataNode:

2.2 Active NameNode:

这就带来问题1:

这个问题的答案就是:

这样的话,当NameNode所在机器宕机,重启NameNode时将edits log加载到内存中即可恢复metadata,这样问题1就解决了;


但这样依旧存在问题2:

2.3 Standby NameNode 和 JournalNode集群:

>>>>>> 解决方案:
引入fsimage文件、JournalNodes集群、Standby NameNode,将Active NameNode中众多的edits log文件同步写入到Standby Namenode中的fsimage文件(该文件是merge了edits log之后的最新完整的metadata),然后将新的fsimage文件去替换Active NameNode中的旧的fsimage文件,从而实现fsimage文件(存储了最新完整的metadata)的更新,从而避免Active NameNode重启时加载众多edits log文件较大耗时。

其解决步骤如下:

这样,当Active NameNode重启时,只需要加载fsimage即可,而不需要加载众多的edits log,从而提升重启速度;

具体过程,如图所示:


图2-1. HDFS主从架构

参考:http://lxw1234.com/archives/2015/08/440.htm

上一篇 下一篇

猜你喜欢

热点阅读