SparkContext初始化综述

2020-05-03  本文已影响0人  ryancao_b9b9

一、初始流程


初始化流程图.png

二、核心元素
1、SparkConf
作为SparkContext构造函数中最重要的入参

2、SparkEnv
基于SparkConf创建SparkEnv,主要包含以下关键性组件:BlockManager、MapOutputTracker、ShuffleFetcher、ConnectionManager

3、SchedulerBackend
根据Master环境变量来判断Spark当前的部署方式,生成相应的SchedulerBackend的不同子类,并作为属性设置到TaskScheduler中

4、TaskScheduler
后续的Task分发、管理者

5、DAGScheduler
(a)维护waiting stages、active stages和failed stages,以及与jobs的映射关系
(b)切分stage

6、WebUI

三、元素协作图


作业提交过程.png
上一篇 下一篇

猜你喜欢

热点阅读