我爱编程

Hbase简单命令

2018-01-28  本文已影响0人  AMZ小楼
搭建Hbase集群
启动HDFS和Hbase
首先要保证你的HDFS是可用的
只要启动主节点就好了,保证下面这三个进程启动
Zookeeper 是HQuorumPeer进程


image.png

image.png
进入终端 hbase shell
命令 status (我这里有点问题,只启动了一个)
image.png
create 'badou_music_table','meta_data','action'
有两个列族 action 和 meta_data
image.png
删除一个列族alter 'badou_music_table',{NAME=>'action', METHOD=>'delete'} image.png
增加一个列族,alter 'badou_music_table',{NAME=>'flags', VERSIONS=>3, IN_MEMORY=>true}
保留最近3个版本
image.png
删除一个表
先 disable 'badou_music_table'
后 drop badou_music_table
image.png
在hdfs上观察
多出来一张表hbase中创建一个表,hdfs上就多一张表
image.png
表是否存在
exists 'badou_music_table'
表是否是激活状态
is_enabled 'badou_music_table'
写数据,创建一个rowkey为1001 ,名字叫忘情水
put 'badou_music_table',  '1001','meta_data:name', 'wangqingshui'
get 'badou_music_table', '1001
image.png
如果想改名字
 put 'badou_music_table',  '1001','meta_data:name', 'elangchuangshuo'
同一个列族下面有很多的子列
image.png
通过timestamp找歌曲
image.png
 put 'badou_music_table','1002','meta_data:name','nanshannan'
生产上如果想用scan通常要加一些过滤条件
image.png
 put 'badou_music_table',  '1002','flags:is_valid', 'True

强制把表在内存里面的数据写到HDFS上
flush 'badou_music_table'
查看文件
hadoop fs -text /hbase/data/default/badou_music_table/c229ccb09abdef59a34094009ae212bf/flags/70f12300037a464d936f96c7ce9ea813
用MapReduce批量的方式实现大数据的读写操作
如果python要加载某一个模块,如果hbase里面有 __init__.py,那么hbase成为python的一个模块,外面与hbase同一级的放置脚本
image.png
Thrift 模块
/home/tomcat/badou/class5/hbase_test/thrift-0.8.0/lib/py/src

查看当前插入的几行
image.png
查看当前运行的任务
hadoop job -list
停止任务
hadoop job -kill job_201802030941_0001
image.png
上一篇下一篇

猜你喜欢

热点阅读