hive 优化

2019-04-01  本文已影响0人  进击的小恶魔
数据倾斜的解决办法:设置负载均衡

案例:双11的数据特别多,别的时间的任务很少,处理双11的reduce跑不完,总挂掉重启。分几个reduce跑,时间可能长一点,但是可以跑的完。正常是一拆2,如果还不行,就是2拆4

数据倾斜之大大表关联 数据倾斜之空间换时间

补充资料:
https://blog.csdn.net/zj360202/article/details/38420575

上一篇 下一篇

猜你喜欢

热点阅读