MapReduce工作流程

2020-06-09  本文已影响0人  Movle

1.流程示意图:

MapReduce工作流程一 Mapreduce工作流程二

2.流程详解

    上面的流程是整个mapreduce最全工作流程,但是shuffle过程只是从第7步开始到第16步结束,具体shuffle过程详解,如下:

3.注意

    Shuffle中的缓冲区大小会影响到mapreduce程序的执行效率,原则上说,缓冲区越大,磁盘io的次数越少,执行速度就越快。
    缓冲区的大小可以通过参数调整,参数:io.sort.mb 默认100M。

上一篇下一篇

猜你喜欢

热点阅读