大数据

hive优化命令

2021-06-19  本文已影响0人  堂哥000
     -- 两种写法信息一致,第二种表描述更丰富
     desc extended  table_name [partition(the_date='20210619')]
     dssc formatted table_name [partition(the_date='20210619')]
alter table table_name replace columns (
  field_one string comment 'first field name'
  ,field_two int comment 'second field name '
) ;
-- 不加(partition)分区对整个表设置文件属性,但是已导入数据不会受到影响
--  加上分区参数不会修改整表,原来的分区内为orc 文件,修改完分区内可读
--  此方法可实现,每个分区的数据文件格式可独立存在
alter table  table_name  partition(pt='20210619')
set fileformat orcfile;
hadoop fs -ls -R /user/hive/warehouse/tmp.db/ |awk '{print $8}'|awk -F'/' '{gsub($(NF-1)"/"$NF,"");print}'
上一篇 下一篇

猜你喜欢

热点阅读