HBase部署

2019-12-18 本文已影响0人 Youngmon

Hbase配置(单节点)

已安装hadoop

获取hbase

cd /usr/local/src

#下载
wget http://mirrors.hust.edu.cn/apache/hbase/hbase-1.2.11/hbase-1.2.11-bin.tar.gz

#解压
tar -zxvf hbase-1.2.11-bin.tar.gz

配置hbase环境

cd /usr/local/src/hbase-1.2.11

#   1.hbase添加JDK环境
echo  "export JAVA_HOME=/usr/local/src/jdk/jdk1.8"  >>  conf/hbase-env.sh  

#   2.修改hbase-site.xml
vi conf/hbase-site.xml
    <configuration>
    <property>
        <name>hbase.rootdir</name>
        <value>file:/home/hadoop/hbase/HFiles</value>
    </property>
    </configuration>
 
 
#   3.添加环境变量
vi /etc/profile
export HBASE_HOME=/usr/local/src/hbase-1.2.11
export PATH=$PATH:$HBASE_HOME/bin

source /etc/profile

启动

bin/start-hbase.sh


hbase shell

什么是非HA模式

非HA模式是相对于HA模式而言的。如果你不知道什么是Hadoop HA模式,那么你用的多半是非HA模式。HA模式是用来防止单点故障的。

什么是单点故障

通俗地说:单点故障就是你的系统太依赖于某一个节点,以至于只要该节点宕掉了,就算整个集群的其他节点都是好的,你的集群也相当于整体瘫痪。
单点故障问题一般会出现在集群的元数据存储节点上,这种节点一般一个集群就一个,它一旦坏了,整个系统就不能正常使用了。
所以说这个词相当于一个贬义词,我们在做系统架构的时候要尽量避免我们搭建的系统有单点故障问题。

Hadoop怎么避免单点故障问题

Hadoop的单点故障一般会出在namenode上(关于什么是namenode的相关资料请自行查询Hadoop的文献,本书由于涵盖范围有限不会详细介绍)。
Hadoop的做法是,同时启动两个namenode:其中一个工作,另一个总是处于后备机(standby)状态,让它只是单纯地同步活跃机(active)的数据,当活跃机宕掉的时候就可以自动切换过去。
这种模式称为HA模式。
HA模式下不能用<namenode主机>:<端口>的模式来访问Hadoop集群,因为namenode主机已经不是一个固定的IP了,而是采用<serviceid>的方式来访问,这个serviceid存储在ZooKeeper里面。

什么是ZooKeeper

ZooKeeper是一个轻量级的分布式架构集群。以往我们(实际上一般人不会干这事,这里的我们指的是Hadoop和HBase的开发者这种组件编写者)在编写组件的时候需要自己编写节点的注册、取消、维持等代码。
比如节点是否存活的检测、节点失效后的处理等这些事情。ZooKeeper的诞生把我们从这些工作量中解放出来了,因为ZooKeeper会启动一个属于它自己的集群,而这个集群干的事情就是维护你的节点,这样你不需要再自己编写这些代码了。目前很多架构,比如Hadoop、HBase等都采用ZooKeeper作为分布式节点管理的解决方案。