apache impala (wrnmmp!)
2017-06-22 本文已影响0人
crazydane
basis introduction
- impala提供了:
- 便捷的query语句来对hadoop下的HDFS, HBASE里面的数据进行操作。
- 处理大型数据。
- 在云环境下使用分布式查询,更高效
- 无需复制或导出/导入步骤,可在不同组件之间共享数据文件。例如,与Pig,与Hive转换,查询和写操作。 Impala可以读取和写入Hive表,启用使用Impala进行简单的数据交换,用于分析Hive生成的数据。
How Impala Works with Apache Hadoop
客户端 - 包括Hui,ODBC客户端,JDBC客户端和Impala Shell的实体都可以与Impala进行交互。这些接口通常用于发出查询或完成管理任务,例如连接到Impala。
•Hive Metastore - 存储有关Impala可用数据的信息。例如,转移让Impala
知道哪些数据库可用,以及这些数据库的结构。创建,删除和更改时
模式对象,将数据加载到表中等等,通过Impala SQL语句,相关的元数据更改是
通过Impala 1.2中引入的专用目录服务自动广播到所有Impala节点。