YARN 工作原理
2018-12-21 本文已影响6人
无羡爱诗诗
1、Hadoop2新增了YARN,YARN的引入主要有两个方面的变更:
其一、HDFS的NameNode可以以集群的方式部署,增强了NameNode的水平扩展能力和高可靠性,水平扩展能力对应HDFS Federation,高可靠性对应HA。
其二、MapReduce将Hadoop1时代的JobTracker中的资源管理及任务生命周期管理拆分成两个独立的组件,资源管理对应ResourceManager,任务生命周期管理对应ApplicationMaster。
2、YARN on HDFS
HDFS的典型结构与HDFS二次结构对比
![](https://img.haomeiwen.com/i14405984/5b8d065241f827ae.png)
![](https://img.haomeiwen.com/i14405984/54f3faa86017ad0b.png)
![](https://img.haomeiwen.com/i14405984/3a11efdbf225cb4a.png)
![](https://img.haomeiwen.com/i14405984/ceb34e22f4a21a13.png)
3、MapReduce on YARN的工作原理
![](https://img.haomeiwen.com/i14405984/6941bc743af630bd.png)
![](https://img.haomeiwen.com/i14405984/daa175481977a96b.png)
![](https://img.haomeiwen.com/i14405984/bcd482e1622c1359.png)
![](https://img.haomeiwen.com/i14405984/0e00b776dfd35304.png)