Spark学习笔记

Spark学习(Python版本):学习笔记目录

2018-08-11  本文已影响68人  马淑

这个系列是跟着林子雨老师的子雨大数据之Spark入门教程(Python版)所做的学习笔记。

软件源以及版本:

学习笔记目录:

1.Spark学习(Python版本):Spark安装
2.Spark学习(Python版本):第一个spark应用程序

Spark RDD

3.Spark学习(Python版本):Spark RDD编程基础
4.Spark学习(Python版本):键值对RDD
5.Spark学习(Python版本):共享变量
6.Spark学习(Python版本):读写HBase数据库

Spark SQL

7.Spark学习(Python版本):Spark SQL中的DataFrame的操作
8.Spark学习(Python版本):连接Hive读写数据(DataFrame)

Spark Streaming

9.Spark学习(Python版本):SparkStreaming基本操作
10.Spark学习(Python版本):使用Kafka数据源
11.Spark学习(Python版本):使用Flume数据源
12.Spark学习(Python版本):DStream转换操作
13.Spark学习(Python版本):DStream输出操作

Spark ML

14.Spark学习(Python版本):构建一个机器学习工作流
15.Spark学习(Python版本):特征处理相关的算法(TFDIF, Word2Vec)

未完待续。。。

附:相关内容

云计算--hdfs dfs 命令
HBase安装
Hive安装
MySQL安装

上一篇下一篇

猜你喜欢

热点阅读