我爱编程

三、分布式资源调度YARN

2018-03-29  本文已影响0人  薛定谔的猫_1406

一、YARN的产生背景

背景1
背景2
由此催生了YARN

二、XXX on YARN

XXX on YARN 架构

三、资源调度框架:作业提交先到ResourceManager,RM会到一个NM上启动一个AM.AM去向RM申请资源,然后通知对应的NM启动一些Container,运行task

1.ResourceManager: RM

2.NodeManager: NM

  1. ApplicationMaster: AM

4.Container

  1. Client

四、YARN的执行流程

YARN的执行流程

五、YARN环境搭建

YARN的配置文件

1. mapred-site.xml

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

2. yarn-site.xml

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

3.启动YARN相关的进程

sbin/start-yarn.sh

4. 验证

jps
    ResourceManager
    NodeManager
http://hadoop000:8088

5. 停止YARN相关的进程

sbin/stop-yarn.sh

提交mr作业到YARN上运行:
/home/hadoop/app/hadoop-2.6.0-cdh5.7.0/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.7.0.jar

hadoop jar

hadoop jar hadoop-mapreduce-examples-2.6.0-cdh5.7.0.jar pi 2 3

上一篇 下一篇

猜你喜欢

热点阅读