Framwork

MapReduce/YARN 架构和任务提交过程

2017-08-27  本文已影响1121人  heamon7

MapReduce/YARN 工作原理

MRv1 的架构

MapReduce v1架构

执行任务的过程:

MRv1 存在的问题

总而言之,JobTracker肩负了资源管理作业控制等两部分工作,这样造成了JobTracker负载过重。从设计的角度来说,未能将资源管理相关功能和应用程序相关功能分开,造成了扩展性、资源利用率和多框架支持存在不足,难以支持多种计算框架

MRv2/YARN 的架构

YARN 架构

MRv2 的基本设计思想是将JobTracker的资源管理和作业控制(作业监控、监控)分拆成两个独立的进程 ResourceManager 和 ApplicationMaster。让资源管理和具体的应用程序无关,它只负责整个集群的资源(内存、CPU、磁盘)管理,而作业控制进程则是与应用程序相关的模块,负责任务切分、任务调度和容错,且每个作业控制进程只负责管理一个作业。
组成:

提交作业过程:

Yarn 提交 Job 过程
大概有三个阶段:
Job submission
  1. Client 想 RM 提交执行 job 申请,RM 接受 job 请求,生成Application ID,返回 job id、staging 工作目录等信息给 Client

Ref:

上一篇下一篇

猜你喜欢

热点阅读