Big Data

MapReduce的uber运行模式

2018-12-09  本文已影响1人  盗梦者_56f2

背景

在有些情况下,运行于Hadoop集群上的一些mapreduce作业本身的数据量并不是很大,如果此时的任务分片很多,那么为每个map任务或者reduce任务频繁创建Container,势必会增加Hadoop集群的资源消耗,并且因为创建分配Container本身的开销,还会增加这些任务的运行时延。如果能将这些小任务都放入少量的Container中执行,将会解决这些问题。Uber运行模式就是解决此类问题的现成解决方案。

条件

Uber运行模式对小作业进行优化,不会给每个任务分别申请分配Container资源,这些小任务将统一在一个Container中按照先执行map任务后执行reduce任务的顺序串行执行。那么什么样的任务,mapreduce框架会认为它是小任务呢?

同时满足上面八个条件才能在作业运行的时候启动Uber模式。

上一篇下一篇

猜你喜欢

热点阅读