大数据

Hadoop踩坑-Hbase篇

2018-09-14  本文已影响82人  林桉

Hadoop环境支持

hadoop 是Apache 软件基金会旗下的一个开源分布式计算平台。以hadoop 文件系统(hdfs)和 mapreduce (google 提出的mapreduce计算框架)为核心的分布式基础架构。


image.png

HDFS搭建

hdfs 是一个高性能的文件系统。具有高容错性,可靠性,高伸缩性等优点。下图为HDFS系统架构图,主要有三个角色,Client、NameNode、DataNode。

image.png
Namenode:namenode是一个名称节点,是hdfs的大脑,它维护着文件系统的目录树。
Secondarynode:第二个名字节点,用于备份,一旦namenode挂掉,那么secondarynode就补上。
Datanode:data节点用来存储数据。�
Client:客户机是用来读写数据。
写流程
读流程

Zookeeper搭建

ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,ZooKeeper以Fast Paxos算法为基础,实现同步服务、配置维护和命名服务等分布式应用。
ZooKeeper 动物园管理员,他是拿来管大象(Hadoop) 、 蜜蜂(Hive) 、 小猪(Pig) 的管理员。


image.png

HBase主要用ZooKeeper来实现HMaster选举与主备切换、系统容错、RootRegion管理、Region状态管理和分布式SplitWAL任务管理等。

Hbase搭建

HBase是一种构建在HDFS之上的分布式、面向列、多版本、非关系型的数据库。在需要实时读写、随机访问超大规模数据集时,可以使用HBase。HBase自底层设计开始即聚焦于各种可伸缩性问题:表可以很“高”,有数十亿个数据行;也可以很“宽”,有数百万个列,使系统有可能提高高效的数据结构的序列化、存储和检索。


image.png

HBase是一个分布式的架构,除去底层存储的HDFS外,HBase本身从功能上可以分为三块:Zookeeper群、Master群和RegionServer群。


image.png
image.png

小白学习 无关利益

感谢:

学习笔记一:hadoop单节点搭建 - 简书

Hadoop:启动与停止命令 - CSDN博客

zookeeper 启动出错问题排查 - 四维空间 - ITeye博客

0基础搭建Hadoop大数据处理-集群安装 - 简书

HBase Getting Started(入门指南) - 简书

HBase之——单节点安装 - CSDN博客 节点冲突

一条数据的HBase之旅,简明HBase入门教程-开篇 - 简书启动HBase Shell

Spark单机部署听风铃的声音新浪博客

学习笔记二:spark单节点搭建 - 简书

spark生态圈整体技术架构图-成都加米谷大数据培训分享 - 简书

『 Spark 』1. spark 简介 - 简书

上一篇下一篇

猜你喜欢

热点阅读