36CDH

2020-02-13  本文已影响0人  文茶君

1.CDH简介

1000台服务器的集群,最少要花费多长时间来搭建好Hadoop集群,包括Hive、Hbase、Flume、Kafka、Spark等等
只给你一天时间,完成以上工作?
对于以上集群进行hadoop版本升级,你会选择什么升级方案,最少要花费多长时间?
新版本的Hadoop,与Hive、Hbase、Flume、Kafka、Spark等等兼容?

Apache Hadoop 不足之处

Cloudera’s Distribution Including Apache Hadoop(CDH)

CDH是静态的。
优点

安装方式

Cloudera Manager是一个管理CDH的端到端的应用。
作用:
管理
监控
诊断
集成


架构


2.CM安装

上面介绍了cm的作用和重要性,那么cm怎么安装呢?
首先是系统环境准备

接下来开始安装实际操作
首先说一下配置:参考上面的架构图,一个server,3个agent。需要3台虚拟机。即sever本身也有一个agent
尽量分配给server多的内存空间
系统环境的安装以上都做了,1,3,4都和前面一样,所以不用做了
关于ssh免秘钥这里做一下



在这里先登录一下是为了出现.ssh文件(每台多做一下)




主要看rsa的权限

ssh-copy-id node02这样只用了一条命令,
跟原来分发秘钥相比大大简化了

可以看到authorized—keys文件有了秘钥



已经可以免密钥登录了
加下来就如法炮制,两两免秘钥登录

配置jdk环境不再赘述,前文已述
对于mysql配置这里写一下


删除user表并赋权GRANT ALL PRIVILEGES ON . TO 'root'@'%' IDENTIFIED BY '123' WITH GRANT OPTION;
然后刷新flush privileges

下载第三方依赖包(三台电脑都要装)
至此系统配置完毕


需要拷贝的文件



解压


进入config修改配置文件 修改主机host 创建用户cloudera-scm 建立文件夹,创建Parcel目录Server节点 Agent节点 制作CDH本地源

分发给其他节点
-r:若给出的源文件是一个目录文件,此时将复制该目录下所有的子目录和文件。


启动
上一篇 下一篇

猜你喜欢

热点阅读