Hive在简书

hive学习(五)——原理解析

2019-08-22  本文已影响0人  大数据阶梯之路

一、Hive的服务端组件

二、Hive的编译过程

(Parser)先把hiveQL转化为抽象语法树AST,(Semantic Analyzer)再把抽象语法树转化为查询块QB,(Logic Plan Generator)之后转化为逻辑查询计划OP Tree,(LogicalOptimizer)再重写逻辑查询计划,(Physical Plan Generator)然后将逻辑查询计划转化为物理查询计划Task Tree,(PhysicalOptimizer)最后选择最佳Join策略。
产物:hiveQL-->抽象语法树-->查询块-->逻辑查询计划-->物理查询计划(MRjobs)-->最佳Join策略
过程:Parser-->Semantic Analyzer-->Logic Plan Generator-->LogicalOptimizer-->Physical Plan Generator-->PhysicalOptimizer

操作符是Hive的最小处理单元,每个操作符处理代表一道HDFS操作或MapReduce作业

借用而来.png

三、Hive的执行原理

Hive的执行入口是Driver,执行的SQL语句首先提交到Driver驱动,然后调用compiler解释驱动,最终解释成MapReduce任务去执行。


图片.png

大致流程是:

附参考文章:https://blog.csdn.net/qq_36864672/article/details/78648248

四、Hive面试常问简易问答

class TestUDF extends UDF{
    //方法
}

附参考文章:
1、hive面试题1
2、hive面试题2
3、MapReduce原理解析

上一篇 下一篇

猜你喜欢

热点阅读