Hbase简单命令

2018-01-28 本文已影响0人 AMZ小楼

搭建Hbase集群
启动HDFS和Hbase
首先要保证你的HDFS是可用的
只要启动主节点就好了，保证下面这三个进程启动
Zookeeper 是HQuorumPeer进程

主

image.png
从

image.png

进入终端 hbase shell
命令 status （我这里有点问题，只启动了一个）

image.png

create 'badou_music_table','meta_data','action'
有两个列族 action 和 meta_data

image.png
删除一个列族alter 'badou_music_table',{NAME=>'action', METHOD=>'delete'}

image.png

增加一个列族，alter 'badou_music_table',{NAME=>'flags', VERSIONS=>3, IN_MEMORY=>true}
保留最近3个版本

image.png

删除一个表
先 disable 'badou_music_table'
后 drop badou_music_table

image.png

在hdfs上观察
多出来一张表hbase中创建一个表，hdfs上就多一张表

image.png

表是否存在
exists 'badou_music_table'
表是否是激活状态
is_enabled 'badou_music_table'
写数据，创建一个rowkey为1001 ，名字叫忘情水
put 'badou_music_table',  '1001','meta_data:name', 'wangqingshui'
get 'badou_music_table', '1001

image.png

如果想改名字
 put 'badou_music_table',  '1001','meta_data:name', 'elangchuangshuo'
同一个列族下面有很多的子列

image.png

通过timestamp找歌曲

image.png

 put 'badou_music_table','1002','meta_data:name','nanshannan'
生产上如果想用scan通常要加一些过滤条件

image.png

 put 'badou_music_table',  '1002','flags:is_valid', 'True

强制把表在内存里面的数据写到HDFS上
flush 'badou_music_table'
查看文件
hadoop fs -text /hbase/data/default/badou_music_table/c229ccb09abdef59a34094009ae212bf/flags/70f12300037a464d936f96c7ce9ea813

用MapReduce批量的方式实现大数据的读写操作
如果python要加载某一个模块，如果hbase里面有 __init__.py，那么hbase成为python的一个模块，外面与hbase同一级的放置脚本

image.png

Thrift 模块
/home/tomcat/badou/class5/hbase_test/thrift-0.8.0/lib/py/src

查看当前插入的几行

image.png

查看当前运行的任务
hadoop job -list
停止任务
hadoop job -kill job_201802030941_0001

image.png

Hbase简单命令

猜你喜欢

热点阅读