Hadoop概述

2017-01-24  本文已影响0人  xiao_小鱼

Hadoop简介

Hadoop是由Apache所开发的分布式系统基础架构,是适合海量数据的分布式存储和分布式计算的平台,Hadoop目前有四个模块,Hadoop common、Hadoop Distributed File System(HDFS)、Hadoop MapReduce和HadoopYarn。

Hadoop1 框架的核心设计是分布式存储(HDFS)和分布式计算(MapReduce)。分布式存储系统是将同一份文件中的数据分散到不同的节点上,利用存储系统对这些文件进行一个总的调度和管理。分布式计算时把一个需要非常巨大计算能力才能解决的问题分成许多小的部分,将这些小的部分分配给不同的计算机进行处理,最后把这些结果综合起来得到最终的结果,在Hadoop2 中核心设计是HDFS2和YARN(Yet Another Resource Negotiator),YARN是一种新的Hadoop资源管理器,可为上层应用提供统一的资源管理和调度,在YARN上面运行分布式计算,典型的计算模型有:MapReduce、Storm以及Spark等。

Hadoop核心架构

上一篇下一篇

猜你喜欢

热点阅读