随笔-生活工作点滴

Hadoop2.0 | YARN架构

2019-07-05  本文已影响12161人  icebreakeros

模型演化

第一代MapReduce框架

第一代MapReduce框架

第二代MapReduce框架

第二代MapReduce框架

编程模型

编程模型

YARN基本组成结构

YARN主要由ResourceManagerNodeManagerApplicationMasterContainer等几个组件构成

YARN基本组成结构

ResourceManager(RM)

RM是全局资源管理器,负责整个系统的资源管理和分配
主要由两个组件构成:调度器和应用程序管理器ASM

调度器
调度器根据容量、队列等限制条件,将系统中的资源分配给各个正在运行的应用程序
不负责具体应用程序相关的工作,比如监控或跟踪状态
不负责重新启动失败任务
资源分配单位用“资源容器”(Resource Container)表示
Container是一个动态资源分配单位,它将内存、CPU、磁盘、网络等资源封装在一起,从而限定每个任务的资源量
调度器是一个可拔插的组件,用户可以自行设计
YARN提供了多种直接可用的调度器,比如Fair SchedulerCapacity Scheduler

应用程序管理器
负责管理整个系统中所有应用程序

ApplicationMater(AM)

用户提交的每个应用程序均包含一个AM

AM主要功能
RM调度器协商以获取资源(用Container表示)
将得到的任务进一步分配给内部的任务
NM通信以启动/停止任务
监控所有任务运行状态,并在任务运行失败时重新为任务申请资源以重启任务

当前YARN自带了两个AM实现
一个用于演示AM编写方法的示例程序distributedshell
一个运行MapReduce程序—MRAppMaster

NodeManager(NM)

NM是每个节点上的资源和任务管理器
定时向RM汇报本节点上的资源使用情况和各个Container的运行状态
接收并处理来自AMContainer启动/停止等各种请求

Container

ContainerYARN中的资源抽象,它封装了某个节点上的多维度资源
YARN会为每个任务分配一个Container,且该任务只能使用该Container中描述的资源
Container不同于MRv1中的slot,它是一个动态资源划分单位,是根据应用程序的需求动态生成的

上一篇下一篇

猜你喜欢

热点阅读