Spark学习笔记

关于Spark中的常见问题及解决方法(3) —— Aggrega

2019-03-30  本文已影响0人  LestatZ

前言

如果你程序中的聚合速度较慢,请先查看 Spark Stragglers/任务执行缓慢部分。

主要症状

可能的原因

这类问题并没有固定的解决方法。 有时候,由于作业中的数据有一些偏斜的键(即数据倾斜),导致作业执行缓慢。

可能的解决方法

参考资料

[BOOK] Spark - The Definitive Guide

上一篇 下一篇

猜你喜欢

热点阅读