Hive的内部表/外部表/分区表/分桶表
2020-05-05 本文已影响0人
DancingBUG
内部表:普通表,相当于mysql的物理表,对应hdfs数据,删除时同时删除元数据和hdfs表数据
外部表:关键字external,指向已存在的hdfs数据,删除时只删除元数据(表结构),指向的hdfs表数据依然存在

分区表:关键字partitioned by,按照partition列存储至hdfs的不同分区目录下的同一个文件,便于并行分析

分桶表:关键字clustered,对数据进行hash,存储至hdfs不同的文件,方便抽样和join查询
