Hadoop安装配置之伪分布模式安装

2019-07-08  本文已影响0人  程序员小华

Hadoop安装部署方式有三种,在这里介绍其中一种安装部署方式——伪分布模式。主要的特点是:在单机上,模拟一个分布式的环境,具备Hadoop的所有功能,即Hadoop伪分布模式包含以下组件:
HDFS:NameNode + DataNode + SecondaryNameNode
Yarn:ResourceManager + NodeManager

1.准备环境
[root@bigdata111 etc]# java -version
java version "1.8.0_144"
Java(TM) SE Runtime Environment (build 1.8.0_144-b01)
Java HotSpot(TM) 64-Bit Server VM (build 25.144-b01, mixed mode)
[root@bigdata111 etc]# cat /etc/hosts
127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
192.168.220.111 bigdata111
[root@bigdata111 etc]# systemctl status firewalld.service
● firewalld.service - firewalld - dynamic firewall daemon
   Loaded: loaded (/usr/lib/systemd/system/firewalld.service; disabled; vendor preset: enabled)
   Active: inactive (dead)
     Docs: man:firewalld(1)
[root@bigdata111 etc]#
2. 安装步骤
[root@bigdata111 hadoop-2.7.3]# pwd
/root/training/hadoop-2.7.3
[root@bigdata111 hadoop-2.7.3]# ll
total 108
drwxr-xr-x. 2 root root   194 Aug 18  2016 bin
drwxr-xr-x. 3 root root    20 Aug 18  2016 etc
drwxr-xr-x. 2 root root   106 Aug 18  2016 include
drwxr-xr-x. 3 root root    20 Aug 18  2016 lib
drwxr-xr-x. 2 root root   239 Aug 18  2016 libexec
-rw-r--r--. 1 root root 84854 Aug 18  2016 LICENSE.txt
-rw-r--r--. 1 root root 14978 Aug 18  2016 NOTICE.txt
-rw-r--r--. 1 root root  1366 Aug 18  2016 README.txt
drwxr-xr-x. 2 root root  4096 Aug 18  2016 sbin
drwxr-xr-x. 4 root root    31 Aug 18  2016 share
[root@bigdata111 hadoop-2.7.3]# 
export JAVA_HOME=/root/training/jdk1.8.0_144
<!--配置数据块的冗余度,默认是3-->
<!--原则冗余度跟数据节点个数保持一致,最大不要超过3-->
<property>  
    <name>dfs.replication</name>
    <value>1</value>
</property>

<!--是否开启HDFS的权限检查,默认是true-->
<!--使用默认值,后面会改为false-->
<!--
<property>  
    <name>dfs.permissions</name>
    <value>false</value>
    </property>             
-->     
<!--配置HDFS主节点的地址,就是NameNode的地址-->
<!--9000是RPC通信的端口-->
<property>  
    <name>fs.defaultFS</name>
    <value>hdfs://bigdata111:9000</value>
</property> 

<!--HDFS数据块和元信息保存在操作系统的目录位置-->
<!--默认是Linux的tmp目录,一定要修改-->
<property>  
    <name>hadoop.tmp.dir</name>
    <value>/root/training/hadoop-2.7.3/tmp</value>
</property>

在该步骤,要先在目录/root/training/hadoop-2.7.3下通过mkdir命令创建tmp目录

<!--MR程序运行容器或者框架-->
<property>  
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
</property> 
<!--配置Yarn主节点的位置-->
<property>  
    <name>yarn.resourcemanager.hostname</name>
    <value>bigdata111</value>
</property>         

<!--NodeManager执行MR任务的方式是Shuffle洗牌-->
<property>  
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>
[root@bigdata111 hadoop]# hdfs namenode -format

格式化命令运行后,出现以下日志信息代表格式化成功:



格式化成功后,查看HDFS数据块和元信息保存目录/root/training/hadoop-2.7.3/tmp,发现出现以下信息:

[root@bigdata111 tmp]# pwd
/root/training/hadoop-2.7.3/tmp
[root@bigdata111 tmp]# tree
.
└── dfs
    └── name
        └── current
            ├── fsimage_0000000000000000000
            ├── fsimage_0000000000000000000.md5
            ├── seen_txid
            └── VERSION

3 directories, 4 files
[root@bigdata111 tmp]# 
start-all.sh

启动成功后,通过Web页面访问hdfs和yarn,hdfs的端口号是: 50070,yarn的端口号是:8088,如下所示:


HDFS Web页面
Yarn Web页面

通过JPS查看JAVA进程可以发现Hadoop有5个组件已经启动:

[root@bigdata111 tmp]# jps
37552 ResourceManager
37242 DataNode
37115 NameNode
37403 SecondaryNameNode
37837 NodeManager
38015 Jps
[root@bigdata111 tmp]# 

至此,Hadoop伪分布模式安装部署成功。

3. Hadoop启动和停止命令
HDFS:start-dfs.sh
Yarn: start-yarn.sh
同时启动HDFS和Yarn:start-all.sh
关闭HDFS和Yarn:stop-all.sh
上一篇 下一篇

猜你喜欢

热点阅读