Impala相较于hive的优劣

2021-02-26  本文已影响0人  一只当归

hive是基于Java编写的开源数据仓库和分析包,目的是将特定的SQL语句编译为MapReduce jar包扔给hadoop去执行,本质上是一个代码转换编译的工具,适用于逻辑复杂的查询,简单查询考虑impala。
impala是使用C++编写的基于hive的大数据查询分析sql执行引擎,使用到了Hive当中的Metastore。适用于实时数据分析,容错机制稍差,但重查一次的成本低,因为不支持UDF,能处理的问题域有一定的限制,与Hive配合使用,对Hive的结果数据集进行实时分析。

上一篇 下一篇

猜你喜欢

热点阅读