程序员技术干货大数据

《Hadoop权威指南》精华-初识Hadoop

2018-06-13  本文已影响24人  GhostStories
image

转载请注明出处:http://wangnan.tech 简书:http://www.jianshu.com/u/244399b1d776

数据!数据!

我们生活在一个数据爆炸的时代,我们必须想办法好好的的储存和分析这些数据

数据储存和分析

  1. 解决硬件故障:使用副本
  2. 解决从无数个硬盘中读取数据到一起去分析:MapReduce编程模型

hadoop是什么?简而言之,hadoop为我们提供了一个可靠且可扩展的储存和分析平台

查询所有数据

MapReduce是一个批量查询处理器,能够在合理的时间范围内处理针对整个数据集的动态查询

不仅仅是批处理

MapReduce更适合那种没有用户在现场等待查询结果的离线使用场景

Hadoop的发展已经超越了批处理本身,实际上,名词"Hadoop"有时被用于指代一个更大的,多项目组成的生态系统,产生了一些可以与hadoop协同工作的处理模式,比如交互式SQL、迭代处理、流处理、搜索,项目例子:Hbase、YARN、Hive、Spark、Storm、Solr

相较其他系统的优势

  1. 关系型数据库


    image
  1. 网格计算
  1. 志愿计算
    MapReduce有三大设计目标:

Hadoop发展简史

本文完

欢迎关注我的微信订阅号:


欢迎关注我的开发者头条独家号搜索:269166

上一篇 下一篇

猜你喜欢

热点阅读