阿里云Maxcomputer SQL 优化

2020-01-11  本文已影响0人  黑曼巴yk

等待问题

等待问题一般分为几大类

常见等待的问题原因

常见处理方案

长尾问题

长尾问题一般分为下面几类

Map(一般是select语句)过程长尾
  1. 常见的Maori端长尾原因
  1. 常见的Map端长尾处理方法
  1. 通过合理调整odps.sql.mapper.split.size参数,来控制Map Instance个数(可能会导致输出小文件变多)
Reduce过程边长
  1. 常见reduce端长尾原因
    分发键分部不均匀,存在热点数据(一个instance处理记录超过1亿条,处理性能就会下降)
  2. 常见reduce端长尾处理方法
  1. 脏数据过滤(比如: 业务上是否考虑将null数据进行过滤)
Join过程长尾
  1. 常见的Join过程长尾原因
    分发键(关键键)分部不均匀。本质山是非主键关联
  2. 常见Join过程长尾处理方法

开发技巧

选表原则
  1. 看数据量
  1. 看产出时间
模型设计原则
  1. 抽取公共表
  1. 产出链路短

代码开发原则

过滤再计算
开发技巧使用

调度原则

设置高优先级
跨天依赖

SQL 优化的本质

本质是不同Task的灵活处理。

上一篇 下一篇

猜你喜欢

热点阅读