Hadoop介绍

2020-10-21  本文已影响0人  乙腾

Overview

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

主要解决,海量数据的存储和海量数据的分析计算问题。

广义上来看,Hadoop通常指的是Hadoop生态圈。

Hadoop版本

1.Apache版本

最原始(最基础)的版本,对于入门学习最好。

官网地址:http://hadoop.apache.org/releases.html

下载地址:https://archive.apache.org/dist/hadoop/common/

2.Cloudera

在大型互联网企业中用的较多。

官网地址:https://www.cloudera.com/downloads/cdh/5-10-0.html

下载地址:http://archive-primary.cloudera.com/cdh5/cdh/5/

3.Hortonworks Hadoop

Hortonworks文档较好。

官网地址:https://hortonworks.com/products/data-center/hdp/

下载地址:https://hortonworks.com/downloads/#data-platform

Hadoop的优势

高可靠性

Hadoop底层维护多个数据副本,即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。

高扩展性

集群间分配任务数据,可方便地扩展数以千计的节点。

高效性

在MapReduce的思想下,Hadoop是并行工作的。

高容错性

能够自动将失败的人物重新分配。

Hadoop组成

Hadoop1.x和Hadoop2.x的区别

image.png
上一篇 下一篇

猜你喜欢

热点阅读