数据仓库-Hive基础(二)Hive 的基本概念

2020-06-22  本文已影响0人  做个合格的大厂程序员

什么是 Hive

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并 提供类SQL查询功能。

其本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据的存储,说白了 hive可以理解为一个将SQL转换为MapReduce的任务的工具,甚至更进一步可以说hive就是一 个MapReduce的客户端

为什么使用 Hive

Hive 架构

image

Hive 与 Hadoop 的关系

Hive利用HDFS存储数据,利用MapReduce查询分析数据

image

Hive与传统数据库对比

hive用于海量数据的离线数据分析

image

总结:hive具有sql数据库的外表,但应用场景完全不同,hive只适合用来做批量数据统计分析

上一篇 下一篇

猜你喜欢

热点阅读