大数据领域精选

【Hive 精选】Hive 架构详解

2023-08-01  本文已影响0人  熊本极客

2.Hive 架构

2.1 架构总览

说明:所谓的 Client 有 2 种分别是 HiveServer2 和 Hive CLI,它包含 CLI、Driver、Compiler 和 Execution Engine 模块的能力。

Metastore、HiveServer2 和 Hive CLI 之间有什么关系?
Hive CLI 不依赖 HiveServer2,但 2 者都依赖 Metastore。

HiveServer2 和 Hive CLI 有啥区别?

SQL 语句的提交流程:UI 调用 Driver 的执行接口,Driver 为查询创建一个会话句柄,并将查询发送给 Compiler 生成执行计划。Compiler 从 Metastore 中获取必要的元数据。这些元数据用于对查询树中的表达式进行类型检查,以及根据查询谓词来修剪分区。Compiler 生成的计划是一个阶段的有向无环图,每个阶段可以是一个 map/reduce 作业。Execution Engine 执行引擎将这些阶段提交给适当的组件,在每个任务(mapper/reducer)中,反序列化读取保存在 HDFS 表或中间结果的数据,接着把中间结果序列化到临时 HDFS 文件,如此类推。

2.2 SQL 语句的提交流程详解

image.png
上一篇 下一篇

猜你喜欢

热点阅读