HadoopJava 杂谈SpringFramework

HBase设置外网访问集群

2019-06-22  本文已影响0人  杨赟快跑

HBase集群搭建在内网,现在需要从外网访问HBase,对数据进行读写。

首先,需要明白HBase客户端连接HBase集群进行数据读写的流程


HBase架构图

1.写流程

1.Client先访问zookeeper,从Region中获取表信息;
2.根据namespace、表名和rowkey根据meta表的数据找到写入数据对应的RegionServerID;
3.通过RegionServerID定位到region;
4.写入数据到Region的Memstore,直到达到一定的阀值(128MB),MemStore中的数据被溢写Flush成一个StoreFile,(与此同时写入相同数据到log预写日志中);
5.随着StoreFile文件的不断增多,当其数量增长到一定阈值后,触发Compact合并操作,将多个StoreFile合并成一个StoreFile,StoreFile底层是HFile,同时进行版本合并和数据删除;
6.单个StoreFile超过一定阀值后,出发Split操作,把当前的RegionSplit分为两个新的Region,父Region此时就会下线,新Split出的2个子Region会被HMaster分配到相应的RegionServer上,使得原先1个Region的压力得以分流到2个Region上。

2.读流程

1.Client发送请求并访问zookeeper,获取meta表信息;
2.通过meta表中的Rowkey,tableName,TimeStamp定位到RegionID;
3.通过这个RegionID查找到相对应的RegionServer
4.查找到RegionServer中,先查找MemStore(写缓存),如果查不到,再进入BlockCache(读缓存)中查询,如果查不到,再进入StoreFile中查(依据StoreFile的索引查),并把结果放在BlockCache中。

所以,HBase客户端进行数据读写不会接触到HMaster,只会接触到zookeeper集群和和所有的regionserver节点。

3.修改HBase的RegionServer端口

HBase默认的RegionServer端口是16020,现在有多个RegionServer,需要为不同的RegionServer配置不同的端口

在Slave1节点上,hbase-site.xml文件添加配置如下

        </property>
                <property>
                <name>hbase.regionserver.port</name>
                <value>16020</value>
        </property>

在Slave2节点上,hbase-site.xml文件添加配置如下

        </property>
                <property>
                <name>hbase.regionserver.port</name>
                <value>16021</value>
        </property>

在Slave3节点上,hbase-site.xml文件添加配置如下

        </property>
                <property>
                <name>hbase.regionserver.port</name>
                <value>16022</value>
        </property>

4.修改客户端/etc/hosts

HBase客户端通过zookeeper获取到regionserver的节点名和端口,例如slave1:16020,slave2:16021,slave3:16022,会解析本机的/etc/hosts文件,获取slave1,slave2,slave3的IP地址,所以,在/etc/hosts添加如下配置

59.69.101.206  slave1
59.69.101.206  slave2
59.69.101.206  slave3

这样,HBase客户端就能知道regionserver的IP和端口了,就能获取和写入数据了。

5.配置路由器

最后,还需要配置路由器,给zookeeper和regionserver节点配置端口映射。
这里的端口映射配置是

59.69.101.206:42181     zookeeper1.ip:2181
59.69.101.206:42182     zookeeper2.ip:2181
59.69.101.206:42183     zookeeper3.ip:2181

59.69.101.206:16020     slave1.ip:16020
59.69.101.206:16021     slave2.ip:16021
59.69.101.206:16022     slave3.ip:16022

5.客户端的hbase-site.xml配置如下

<property>
<name>hbase.zookeeper.quorum</name>
<value>59.69.101.206:42181,59.69.101.206:42182,59.69.101.206:42183</value>
</property>
上一篇 下一篇

猜你喜欢

热点阅读