大数据,机器学习,人工智能Mac学习大数据玩转大数据

【Mac大数据开发】第三篇-Hadoop概论

2019-06-26  本文已影响1人  irving_yuan

1.Hadoop起源

2.Hadoop的优势

3.Hadoop的组成

  1. HDFS
    一个高可用,高吞吐量的分布式文件系统
  2. MapReduce
    一个分布式的离线并行计算框架
  3. Yarn
    任务调度与集群资源管理的框架
  4. Common
    一些基础的支持模块功能(RPC、序列化机制、Configuration、日志等)


    hadoop的组成部分

4.HDFS架构概述

HDFS系统具有一下几种角色的节点

5.Yarn架构概述

Yarn集群中,节点主要包含4个角色(前两个是核心)

6.MapReduce架构概述

MapReduce将计算过程分成两个阶段
Map对数据并行处理
Reduce阶段对Map的结果进行整合汇总

上一篇 下一篇

猜你喜欢

热点阅读