Spark基础介绍

2023-04-12  本文已影响0人  Colleen_oh

由于工作需要,这边需要学习大数据,先从spark开始,主要是从blibli的黑马程序员那里学习的,下面将记录重点

1. Spark简介

Spark是一款分布式内容计算的同意分析引擎,其特点就是对任意类型的数据进行自定义计算。

2. Spark VS Hadoop

对比图

尽管Spark相对于hadoop而言具有较大优势,但spark并不能完全替代hadoop

3. Spark特点

简单运用

编程比较简单

通用性强

提供了很多模块、同时也有多个代码API


通用性强

运行方式

支持多种运行方式,包括在Hadoop和Mesos上,也支持Standalone的独立运行模式,同时也可以运行在云Kubernetes上。对于数据源而言,Spark支持从HDFS、Hbase、Cassandra以及Kafka等多种途径获取数据。

4. SPark框架模块

5. Spark运行模式

下面列举几种本地模式

参考:https://www.bilibili.com/video/BV1Jq4y1z7VP?p=3&vd_source=4f8aa8eaabf77c7c85e5cab32d59ed0c

上一篇 下一篇

猜你喜欢

热点阅读