大数据技术分享

Spark总结篇(一)

2019-10-17  本文已影响0人  code_solve

这是一篇是划水的。。。。随便看看就好!!!!

Spark特点

以下特点来源官网主页,仅做翻译

Spark 和 MapReduce

1.Spark可以基于内存处理数据,MR每次要落地磁盘
2.Spark有DAG有向无环图优化
3.Spark是粗粒度资源申请,MR是细粒度资源申请
4.Spark中有各种算子 ,MR中只有map 和reduce
5.Spark的shuffle 向对于MR来说有自己的优化同时有bypass机制

Spark运行模式

Spark核心RDD

#####################################################################################
感觉Spark很多东西网上都是有现成的,写起来也没啥成就感,
暂时还是先放放吧~~后续补充一下各个知识点的关键字,
大家网上搜索一下也就完事了,
没必要自己整~~~~

Spark资源调度

Spark任务调度

二次排序问题

分组取topN问题#

广播变量 累加器

Spark-Shuffle

Shuffle文件的寻址

内存管理

上一篇下一篇

猜你喜欢

热点阅读