技术文大数据程序员

Hive的表的创建及外部表、分区表介绍

2016-10-28  本文已影响2735人  心_的方向

创建表的三种方式

  1. 第一种创建方式:普通方式(最常用)
# 指定标的类型和表的名称
CREATE [TEMPORARY] [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_name 
# 指定每列的名称和类型
  [(col_name data_type [COMMENT col_comment], ...)]
# 对表的说明
  [COMMENT table_comment]
# 指定分区表的列名称,列类型
  [PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)]
# 指定每列的分隔符、数据类型的类型
  [
   [ROW FORMAT row_format] 
   [STORED AS file_format]
     | STORED BY 'storage.handler.class.name' [WITH SERDEPROPERTIES (...)] 
  ]
# 指定数据文件存储在HDFS的什么位置
  [LOCATION hdfs_path]
# 表的属性设置
  [TBLPROPERTIES (property_name=property_value, ...)] 
# 子查询
  [AS select_statement];  

hive (test_db)> load data local inpath '/opt/datas/emp.txt' overwrite into table emp;

hive (test_db)> load data local inpath '/opt/datas/dept.txt' overwrite into table dept;

hive16.png
hive17.png
  1. 第二种创健方式:把子查询的结果作为一张新表。适用于需要保存查询的中间结果。
  1. 第三种创建方式:复制另外一个表的结构。

Hive两种表类型

如果在创建表时不指定external关键字,则默认的是创建管理表(内部表),内部表对应的目录必须存储在hive的数据仓库中。


hive21.png

还有一种表是指定external关键字的表,即外部表,外部表的数据文件可以自己指定目录(不在局限于hive数据仓库中),指定对的目录下面的数据文件及为这个表的数据文件。

内部表和外部表的区别

  1. 执行删除表命令操作时,对于内部表,会删除元数据和存储的数据,而对于外部表只会删除元数据库里的元数据信息,而不会删除存储的数据。这样可以防止多个部门同时使用一个表时,一个部门删除数据文件导致其他部门不能使用的情况。方便共享数据。
  2. 内部表默认存储在数据仓库中,而外部表一般通过location自己指定目录,便于存放在仓库外。

Hive分区表

  1. 创建分区表


    hive23.png
  2. 向分区表加载数据


    hive24.png
    hive25.png
  3. 查看分区表


    hive26.png
    hive27.png
  4. 查询分区表中数据


    hive28.png
上一篇 下一篇

猜你喜欢

热点阅读