HBase 介绍
2018-05-23 本文已影响0人
金刚_30bf
Apache的 Hadoop数据库, 是一个分布式的、 可扩展的、 支持大数据存储的数据库。
当需要对大数据进行随机访问、实时读写时使用。
HBase的目标是在廉价的商品硬件上管理非常大的表,数十亿行* 数百万列。
HBase是一个开源的、 分布式的、 版本化的、non-relational的数据库,是基于Google's Bigtable: A Distributed Storage System for Structured Data论文实现的。
Features
线性可扩展和模块可扩展。
严格一致的读取和写入。
自动和可配置的表分片
RegionServers之间的自动故障转移支持。
使用Apache HBase表来支持Hadoop MapReduce作业。
易于使用Java API进行客户端访问。
Block缓存和Bloom 过滤器进行实时查询。
通过服务器端过滤器查询( predicate push down)谓词下推。
Thrift网关和支持XML,Protobuf和二进制数据编码选项的REST-ful Web服务。
基于可扩展jruby(JIRB)shell。
支持通过Hadoop指标子系统将度量标准导出到文件或Ganglia; 或通过JMX。