Hadoop大数据玩转大数据

hbase介绍与安装

2014-08-17  本文已影响616人  eesly_yuan

HBase是一个基于HDFS(Hadoop Distributed File System),开源的,基于列存储模型的可扩展的分布式数据库,支持大型表的结构化数据存储。据说,Facebook之所以选择了 Hbase,是因为他们HBase适用于处理以下两种类型的数据模式:1.一小组经常变化的临时数据;2.一组不断增加但很少访问的数据。

更详细内容可以参考HBASE
文章主要内容来自初学HBase的几个问题

什么是HBASE

HBase,是Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。使用HBase技术可以在廉价的PC服务器上搭建起大规模结构化的存储集群。它底层的文件系统使用HDFS,使用Zookeeper来管理集群的HMaster和各Region server之间的通信,监控各Region server的状态,存储各Region的入口地址等。

何时用HBASE

HBase就是BigTable的开源实现,当然,也建立在HDFS(GFS的开源实现)和Hadoop(MapReduce的开源实现)、Zookeeper(Chubby的开源实现)的基础上。
何时用HBase呢?在下面几种情况下,可以考虑使用HBase替代关系数据库:
系统需要适应不同种类的数据格式和数据源,不能预先严格定义模式,需要处理大规模数据;
不强调数据之间的关系,所要存储的数据是半结构化或非结构化的;
数据非常稀疏;
想要更好的进行扩展;

HBASE系统架构

HBase架构包括HBase Client、Zookeeper、HMaster、HRegionServer、HStore存储几个部分


2ii6Bz.png
HBase常用操作

List;
Create;
Put;
Scan;
Get;
Delete;
Disable;
Drop;
HBASE安装

这个一定要参考官网,其他中文搜索结果,对应的版本可能不太对。官网虽然是英文,但讲得还是比较清楚的
hbase.apache官网

reference

上一篇下一篇

猜你喜欢

热点阅读