Spark-1.6.1 SQL与Apache Hive SQL的

2016-06-04  本文已影响1426人  日月明心

与Apache Hive的兼容性#

Spark SQL 被设计成与Hive Metastore(元数据), SerDes 和UDFs兼容. 目前Spark SQL里的 Hive SerDes 和 UDFs 是基于Hive 1.2.1, 同时 Spark SQL 可以连接不同版本的Hive Metastore (从 0.12.0 到 1.2.1. 可以查看Interacting with Different Versions of Hive Metastore ).

在Hive数据仓库中部署Spark SQL#

Spark SQL Thrift JDBC 服务是设计成与现有的Hive设备是"开箱即用"的兼容。你不需要修改现有Hive的Metastore(元数据)或更改数据的位置或表的分区等。

Spark SQL支持的Hive特性#

Spark SQL支持绝大多数的Hive特性,例如:

不支持的Hive功能#

下面是当前不支持的Hive特性,其中大部分特性在实际的Hive使用中很少用到。

主要Hive特性

底层Hive特性

Hive 输入/输出格式

Hive优化
部分Hive优化还没有添加到Spark中。没有添加的Hive优化(比如索引)对Spark SQL这种in-memory计算模型来说不是特别重要。下列Hive优化将在后续Spark SQL版本中慢慢添加。

上一篇 下一篇

猜你喜欢

热点阅读