Java相关

大数据 - Hbase

2020-04-03  本文已影响0人  万福来

大数据 - Hbase

Hbase介绍

Hbase是一种分布式NoSql数据库,不支持sql作为查询语言。

Hbase架构

image.png

存储设计

在Hbase中,表被分割成多个更小的块然后分散存储在不同的服务器上,这些小块叫做Regions,
存放Regions的服务器叫RegionServer。Master负责处理不同的RegionServer之间的Region的分发。在Hbase实现中HRegionServer和HRegion类代表RegionServer和Region。HRegionServer除了包含一些HRegions之外,还处理两种类型的文件用于数据存储

HLog

HFile

HFile是Hbase在HDFS中存储数据的格式,它包含多层的索引,这样在Hbase检索数据的时候就不用完全的加载整个文件。索引的大小(keys的大小,数据量的大小)影响block的大小,在大数据集的情况下,block的大小设置为每个RegionServer 1GB也是常见的。

Hbase 数据模型

Hbase数据模型设计

Hbase与关系型数据库对比


image.png

行健设计

关键部分,直接关系到后续服务的访问性能。如果行健设计不合理,后续查询服务效率会成倍的递减。

列簇设计

列簇是一些列的集合,一个列簇的成员有相同的前缀,以冒号(:)作为分隔符。

上一篇下一篇

猜你喜欢

热点阅读