Hadoop 简介

2021-04-21  本文已影响0人  珺王不早朝

1. 定义


狭义上讲,Hadoop 是一个分布式的 数据存储与数据计算 框架,主要包括:

广义上 Hadoop 指的是 Hadoop 生态圈,主要包括(但不限于)以下技术栈:

2. 起源


创造者:道 • 卡丁(Doug Cutting)
参考了Google的三篇论文:

演变关系:

3. 发行版本


市面上常见的 Hadoop 发行版有以下 3 种:

  1. Apache Hadoop
    下载地址:http://hadoop.apache.org/
    原生版本 -- 适合用于学习
    优点:开源贡献者多、更新快、参考资料多(适用于学习)
    缺点:版本管理比较混乱,版本之间兼容性差
  2. CDH (Cloudera's Distribution including Apache Hadoop)
    官网地址:https://www.cloudera.com/
    收费版本 -- 适合生产环境中使用
    优点:生态圈内各框架版本标准化,解决了版本兼容性问题
  3. HDP (Hortonworks Data Platform)
    官网地址:https://hortonworks.com/
    开源版本 -- 但不常用
    优点:开源 + web 管理界面
Apache Hadoop 主要版本

4. Hadoop 优缺点


优点:
缺点:

上一篇:大数据学习笔记目录

下一篇:Apache Hadoop

上一篇 下一篇

猜你喜欢

热点阅读