Hadoop

111.Parquet表的使用

2022-08-03  本文已影响0人  大勇任卷舒

111.1 数据准备

111.2 创建Parquet表

set parquet_file_size=512M;
set COMPRESSION_CODEC=snappy;
drop table if exists catalog_sales;
create table default.catalog_sales 
stored as parquet
as select * from tpcds_text_15.catalog_sales;
[root@ip-168-12-26-81 impala-parquet]# impala-shell -f load_parquet.sql 
Starting Impala Shell without Kerberos authentication
[root@ip-168-12-13-67 ~]# hadoop fs -du -h /user/hive/warehouse

111.3 Parquet block size

大数据视频推荐:
腾讯课堂
CSDN
AIops智能运维机器学习算法实战
ELK入门精讲
AIOps智能运维实战
ELK7 stack开发运维
大数据语音推荐:
ELK7 stack开发运维
企业级大数据技术应用
大数据机器学习案例之推荐系统
自然语言处理
大数据基础
人工智能:深度学习入门到精通

上一篇下一篇

猜你喜欢

热点阅读