扯淡坚持写我爱编程

hadoop(1):hadoop概述

2016-12-31  本文已影响42人  dodo_lihao

hadoop概述

hadoop是 Doug CuttingLucene
之后的一个项目
主要用于 计算
是一个 开源,可靠,可扩展 的分布式计算框架
主要有

当然,hadoop1 和 hadoop2 的一些名词有变化
但是,对应的实现,是没有太大区别的
好处是,可以多台机器同时处理,通过心跳去及时获取计算结果


hadoop的场景

一般可以用于

对应的hadoop生态圈


hadoop生态图

Hadoop核心

Hadoop Common


hdfs相关

namenode

datanode

secondnamenode


yarn Architecture构架图

yarn (Yet Another Resource Negotiator,另一种资源协调者)
整个集群的资源调度,同时监控
比如,一个任务需要的cpu,内存等
这里ResourceManager是总的管理者,所有nodemanager的都由它管理
nodemanager一般都在不同的机器上

一般流程


hadoop核心 MapReduce

Map任务

Reduce任务

上一篇 下一篇

猜你喜欢

热点阅读