EMR Remote Shuffle Service

2021-02-23  本文已影响0人  sparkle123

ESS(EMR Remote Shuffle Service)是EMR在优化计算引擎的Shuffle操作上,推出的扩展组件。

背景信息

目前Shuffle方案缺点如下:

EMR推出的基于Shuffle的ESS服务,可以优化目前方案的问题。优势如下:

ESS架构图

image.png

使用ESS

Spark使用ESS时,只需在提交Spark作业时添加如下两个配置项

spark.shuffle.manager   org.apache.spark.shuffle.ess.EssShuffleManager 固定值
spark.ess.master.address  <ess-master-ip>:<ess-master-port>

【参考】
https://developer.aliyun.com/article/772328
https://developer.aliyun.com/article/779686

上一篇下一篇

猜你喜欢

热点阅读