大数据技术分享

Hive优化

2019-06-14  本文已影响0人  zealscott

Hive简单优化与定期ETL

Hive优化

启用压缩

优化连接

可以通过配置Map连接和倾斜连接的相关属性提升连接查询的性能。

避免全局排序

优化limit操作

启用并行执行

使用单一Reduce

通过为group by操作开启单一reduce任务属性,可以将一个查询中的多个group by操作联合在一起发送给单一MapReduce作业。

<property>
    <name>hive.multigroupby.singlereducer</name>
    <value>true</value>
</property>

控制并行Reduce任务

启用向量化

启用基于成本的优化器

Crontab

Crontab权限

Crontab命令

crontab [-u user] file
crontab [-u user] [-e | -l -r]

Crontab文件

执行

上一篇 下一篇

猜你喜欢

热点阅读