hadoop大数据大数据,机器学习,人工智能

《十小时入门大数据》学习笔记之Hadoop核心组件YARN

2018-12-17  本文已影响49人  腊月的梅花
目录

1、YARN 产生背景

在Hadoop1.X时,MapReduce是Master/Slave的架构,1个JobTracker带多个TaskTracker
JobTracker:负责资源管理和作业调度
TaskTracker:定期向JT汇报本节点的健康状况、资源使用情况、作业执行情况;接受来自JT的命令:启动任务/杀死任务

2、YARN概述

3、YARN架构(面试考点,务必要了解整个架构的执行流程)

1)ResourceManager:RM
整个集群同一时间提供服务的RM只有一个,负责集群资源的统一管理和调度;处理客户端的请求:提交一个作业、杀死一个作业;监控NM,一旦某个NM挂了,则该NM上运行的任务需要告诉我们的AM该如何处理;
2)NodeManager:NM
整个集群中有多个,负责自己本身节点资源管理和使用,定时向RM汇报本节点的资源使用情况;接受并处理来自RM的各种命令:启动Container;
处理来自AM的命令;单个节点的资源管理;
3)ApplicationMaster:AM
每个应用程序对应一个AM:MR、Spark,负责应用程序的管理;为应用程序向RM申请资源(core、memory),分配给内部task,需要与NM通信:启动/停止task,task是运行在Container里面,AM也是运行在Container里面的。
4)Container
封装了CPU、Memory等资源的一个容器;是一个任务运行环境的抽象
5)Client
提交作业;查看作业运行进度;杀死作业

image.png

4、YARN执行流程

image.png

5、YARN环境搭建(单节点)

1)使用版本

2)修改配置文件

#复制mapred-site.xml.template重命名为mapred-site.xml
cp mapred-site.xml.template  mapred-site.xml 
#打开mapred-site.xml 
vim mapred-site.xml 

把下面代码添加到mapred-site.xml 文件中即可

<property>
    <name>mapreduce.framework.name</name>
       <value>yarn</value>
   </property>
效果如图 image.png
<property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>

3)启动

sbin/start-yarn.sh

4)验证
jps:多次两个进程NodeManager、 ResourceManager
打开浏览器:http://localhost:8088/

image.png

5)停止

sbin/stop-yarn.sh

6、提交MapReduce作业到YARN上执行

在/home/hadoop/app/hadoop-2.6.0-cdh5.7.0/share/hadoop/mapreduce
路径下,有官方提供的MapReduce的案例jar包:hadoop-mapreduce-examples-2.6.0-cdh5.7.0.jar
在终端输入以下命令:

#这条命令是运行官方提供的计算pi的案例
hadoop jar hadoop-mapreduce-examples-2.6.0-cdh5.7.0.jar pi 2 3

在浏览器中输入 http://localhost:8088/ 可以看到刚刚提交的作业,刷新页面查看作业的运行状态。

image.png
在终端可以查看到运行的结果
image.png
上一篇 下一篇

猜你喜欢

热点阅读