CDH下安装Spark服务

2021-06-21 本文已影响0人小KKKKKKKK

一、Spark是什么？

是一个基于内存计算的开源的集群计算系统，Spark 启用了内存分布数据集，除了能够提供交互式查询外，它还可以优化迭代工作负载。

它取代现有生态系统中的什么? 实际上Spark不能代替任何传统的Hadoop生态系统。因为Hadoop 2,它只是另一个运行在 YARN容器的应用程序。因此它非常适合在Hadoop生态系统。它提供可测试可阅读可维护等方式编程，解放了我们编写大量MapReduce工作的痛苦，而且提高性能。

进入Cloudera Manager主页

image.png

选择需要安装的集群
添加服务

image.png
选择spark

image.png

继续
选择依赖

image.png
继续
选择角色

image.png
继续
配置

image.png
继续

image.png

开始安装
等待
继续

image.png
安装完成
完成