Hadoop2.0 | YARN架构
模型演化
第一代MapReduce框架
第一代MapReduce框架第二代MapReduce框架
第二代MapReduce框架编程模型
编程模型YARN基本组成结构
YARN
主要由ResourceManager
、NodeManager
、ApplicationMaster
和Container
等几个组件构成
ResourceManager(RM)
RM
是全局资源管理器,负责整个系统的资源管理和分配
主要由两个组件构成:调度器和应用程序管理器ASM
调度器
调度器根据容量、队列等限制条件,将系统中的资源分配给各个正在运行的应用程序
不负责具体应用程序相关的工作,比如监控或跟踪状态
不负责重新启动失败任务
资源分配单位用“资源容器”(Resource Container
)表示
Container
是一个动态资源分配单位,它将内存、CPU
、磁盘、网络等资源封装在一起,从而限定每个任务的资源量
调度器是一个可拔插的组件,用户可以自行设计
YARN
提供了多种直接可用的调度器,比如Fair Scheduler
和Capacity Scheduler
等
应用程序管理器
负责管理整个系统中所有应用程序
ApplicationMater(AM)
用户提交的每个应用程序均包含一个AM
AM
主要功能
与RM
调度器协商以获取资源(用Container
表示)
将得到的任务进一步分配给内部的任务
与NM
通信以启动/停止任务
监控所有任务运行状态,并在任务运行失败时重新为任务申请资源以重启任务
当前YARN
自带了两个AM
实现
一个用于演示AM
编写方法的示例程序distributedshell
一个运行MapReduce
程序—MRAppMaster
NodeManager(NM)
NM
是每个节点上的资源和任务管理器
定时向RM
汇报本节点上的资源使用情况和各个Container
的运行状态
接收并处理来自AM
的Container
启动/停止等各种请求
Container
Container
是YARN
中的资源抽象,它封装了某个节点上的多维度资源
YARN
会为每个任务分配一个Container
,且该任务只能使用该Container
中描述的资源
Container
不同于MRv1
中的slot
,它是一个动态资源划分单位,是根据应用程序的需求动态生成的