hadoop集群
2018-07-28 本文已影响0人
第三个账号
起源:
google三篇论文
GFS,MapReduce,BigTable
Hadoop子项目:
Core:一套分布式文件系统及支持Map-Reduce的计算框架
HDFS:分布式文件系统
MapReduce:一种编程模型,用于大规模数据集(大于1TB)的并行运算。
Zookeeper:分布式协同系统
Pig:高级过程语言,对分布式数据集进行类似 SQL 的查询,简化 Hadoop 的使用。
Hive:HDFS上的数据仓库。提供了类似SQL的语法HiveQL进行数据查询。
Hbase:HDFS上的数据库