Hive调优
2022-01-30 本文已影响0人
大空翼123
宏观调优思路
1.资源充足加内存
2.数据接入慢调优接入工具Sqoop/Datax
3.Hive参数调优
4.sql调优
5.调整模型,提高模型质量和复用度。减少join
6.调度链路优化,实时性要求高的模型先产出,调整调度顺序
具体问题调优
1.数据倾斜问题的确认,排查
2.小文件的影响、初现场景与处理办法
3.表join原则
1.资源充足加内存
2.数据接入慢调优接入工具Sqoop/Datax
3.Hive参数调优
4.sql调优
5.调整模型,提高模型质量和复用度。减少join
6.调度链路优化,实时性要求高的模型先产出,调整调度顺序
1.数据倾斜问题的确认,排查
2.小文件的影响、初现场景与处理办法
3.表join原则