Linux大数据教程玩转大数据大数据

Yarn 详细工作流程

2022-01-01  本文已影响0人  坨坨的大数据
image.png

(0)MR程序提交到客户端所在的节点。
(1)YarnRunner向ResourceManager申请一个Application。
(2)RM将该Application的资源路径返回给YarnRunner。
(3)YarnRunner将运行所需资源提交到HDFS上。
(4)程序资源提交完毕后,申请运行mrAppMaster。
(5)RM将用户的请求初始化成一个Task。
(6)其中一个NodeManager领取到Task任务。
(7)该NodeManager创建容器Container,并产生MRAppmaster。
(8)Container从HDFS上拷贝资源到本地。
(9)MRAppmaster向RM 申请运行MapTask资源。
(10)RM将运行MapTask任务分配给另外两个NodeManager,另两个NodeManager分别领取任务并创建容器。
(11)MR向两个接收到任务的NodeManager发送程序启动脚本,这两个NodeManager分别启动MapTask,MapTask对数据分区排序。
(12)MrAppMaster等待所有MapTask运行完毕后,向RM申请容器,运行ReduceTask。
(13)ReduceTask向MapTask获取相应分区的数据。
(14)程序运行完毕后,MR会向RM申请注销自己。

上一篇下一篇

猜你喜欢

热点阅读