大数据程序员

大数据||MapReduce的shuffle

2018-02-14  本文已影响23人  明明德撩码

mapreduce的数据处理过程中,shuffle出于map和Reduce之间。
Shuffle:洗牌或弄乱。
Collections.shuffle(List):随机地打乱参数list里的元素顺序。
MapReduce里Shuffle:描述着数据从map task输出到reduce task输入的这段过程。

mapreduce处理过程 input --> map --> shuffle --> reduce -->output

MapReduce shuffle

MapReduce优化

MapReduce Shuffle过程如何在Job中进行设置

image.png
上一篇下一篇

猜你喜欢

热点阅读