Yarn 详细工作流程

2022-01-01 本文已影响0人坨坨的大数据

image.png

（0）MR程序提交到客户端所在的节点。
（1）YarnRunner向ResourceManager申请一个Application。
（2）RM将该Application的资源路径返回给YarnRunner。
（3）YarnRunner将运行所需资源提交到HDFS上。
（4）程序资源提交完毕后，申请运行mrAppMaster。
（5）RM将用户的请求初始化成一个Task。
（6）其中一个NodeManager领取到Task任务。
（7）该NodeManager创建容器Container，并产生MRAppmaster。
（8）Container从HDFS上拷贝资源到本地。
（9）MRAppmaster向RM 申请运行MapTask资源。
（10）RM将运行MapTask任务分配给另外两个NodeManager，另两个NodeManager分别领取任务并创建容器。
（11）MR向两个接收到任务的NodeManager发送程序启动脚本，这两个NodeManager分别启动MapTask，MapTask对数据分区排序。
（12）MrAppMaster等待所有MapTask运行完毕后，向RM申请容器，运行ReduceTask。
（13）ReduceTask向MapTask获取相应分区的数据。
（14）程序运行完毕后，MR会向RM申请注销自己。

Yarn 详细工作流程

猜你喜欢

热点阅读