Hadoop集群搭建笔记

2019-04-30  本文已影响0人  董家二少

集群分类

Hadoop的集群分为HDFS集群和YARN集群,两者逻辑上分离,物理上常在一起

集群部署

Hadoop的部署方式有三种:standalone(独立模式),pseudo-distributed(伪分布模式),cluster(集群模式),其中前两者是单机模式

服务器准备

vm服务器,centos
采取nat联网的方式

服务器系统设置

免密码ssh设置
现在确认能否不输入口令就用ssh登录localhost:
$ ssh localhost

如果不输入口令就无法用ssh登陆localhost,执行下面的命令:
$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa 
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

JDK安装

rpm -qa | grep java
rpm -e --nodeps XXXXX

安装包的目录结构

配置文件的修改

一般在主节点上进行修改,完成之后scp下发到其他各个从节点

配置hadoop

vim hadoop-env.sh
export JAVA_HOME=/root/app/jdk1.8.0_65

  1. 指定hadoop所使用的文件系统schema(URI),HDFS主节点的namenode地址,设置fs.defaultFS
  2. 指定hadoop运行时产生的文件的存储目录hadoop.tmp.dir,默认为/tmp/hadoop-${user.name}
  1. 指定hdfs副本的数量dfs.replication,默认是3份
  2. 设置hadoop.namenode.secondary.http-address
  1. 指定yarn主节点resourcemanager地址,配置项为yarn.resoucemanger.hostname,值为node-1
  2. 配置nodemanager上运行的附属服务,需要配置mapreduce_shuffle,才可以运行mr程序默认值。
    配置项yarn.resourcemanager.aux-service,值为mapreduce_shuffle

远程拷贝批量下发hadoop配置

scp -r /export/server/hadoop-2.7/ root@node-2:/export/server/
scp -r /etc/profile root@node-2:/etc/
source /etc/profile

其他

Hadoop集群启动

要启动Hadoop集群,需要启动HDFS集群和Yarn集群,首次启动时,必须进行格式化,并且格式化只能进行一次。

启动的方式包括两种单一服务启动和脚本一键启动(主节点机器上执行,前提是配置了slave文件和ssh免密登录)

启动完成之后,使用jps命令查看

上一篇 下一篇

猜你喜欢

热点阅读