Spark架构师2-开发调优和资源调优
2020-10-23 本文已影响0人
fat32jin
1 、数据倾斜 0:15:00
10招调优
1.1 mapreduce回顾
image.png1.2 spark应用程序流程 ~0:42:00
image.png1.2 避免数据倾斜
1.2.1 HDFS倾斜
image.png1.2.1 kafka倾斜
image.pngimage.png
1.2.3 定位处理逻辑 Stage和Task
image.png image.png image.png备注: 水塘抽样