分布式资源管理系统:YARN

2016-12-29  本文已影响1112人  曹振华

一 产生背景

运维成本:
   如果采用“一个框架一个集群”的模式,则可能需要多个管理员管理这些集群;进而增加运维成本,而共享模式通常需要少数管理员即可完成多个框架的统一管理。
数据共享:
   随着数据量的暴增,跨集群间的数据移动不仅需花费更长的时间,且硬件成本也会大大增加,而共享集群模式可让多种框架共享数据和硬件资源,将大大减小数据移动带来的成本。
MR v1版本的缺陷:
   扩展性受限制,单点故障,不支持其他分布式计算框架.

二 YARN 的由来

Yet Another Resource Negotiagor:又一个计算框架
Hadoop2.x 中发布
它是统一的集群资源管理框架,用来负责集群的管理和调度.


Paste_Image.png

三 YARN基本框架

Paste_Image.png

四. YARN运行过程剖析

Paste_Image.png Paste_Image.png

五. YARN资源调度过程

Paste_Image.png Paste_Image.png Paste_Image.png Paste_Image.png Paste_Image.png

六. 运行在YARN上的计算框架

Paste_Image.png Paste_Image.png Paste_Image.png Paste_Image.png Paste_Image.png Paste_Image.png Paste_Image.png Paste_Image.png Paste_Image.png

七. 日志分析系统架构

Paste_Image.png Paste_Image.png Paste_Image.png Paste_Image.png Paste_Image.png Paste_Image.png Paste_Image.png Paste_Image.png
上一篇下一篇

猜你喜欢

热点阅读