spark+hbase我爱编程

统计HBase表行数的四种方式

2018-05-10  本文已影响0人  和腐朽说再见

有时候我们需要统计HBase表的行数,一般要么是写MR程序,要么是写SQL。以下就是可用的几种方式:

HBase Shell自带的统计函数命令
hbase> count 't1'
hbase> count 't1',INTERVAL => 100000
hbase> count 't1', CACHE => 1000
hbase> count 't1', INTERVAL => 10, CACHE => 1000

注意:其中,INTERVAL为统计的行数间隔,默认为1000,CACHE为统计的数据缓存。这种方式效率很低,如果表行数很大的话不建议采用这种方式。

hbase org.apache.hadoop.hbase.mapreduce.RowCounter 'tablename'

解释:这种方式效率比上一种要高很多,调用的hbase jar中自带的统计行数的类。

创建HiveHBase的关联表,将HBase当作Hive的外部表。

上一篇 下一篇

猜你喜欢

热点阅读