大数据

hive表之 order by、sort by、cluster

2019-11-02  本文已影响0人  飞不高的老鸟

order by 语法操作

创建测试表并加载数据。

hive> create table recommend.test_tb(userid string, name string, age int)
                               > row format delimited
                               > fields terminated by ',';

数据加载。

hive> select * from recommend.test_tb;
OK
1   Jack    21
3   Tom 19
5   Will    20
4   Lily    28
7   zs  25
6   lss 22

使用 order by 语义进行处理, order by 语义有两个排序方式的选择--升序和降序,其中默认为升序。

hive> select * from recommend.test_tb order by userid;
OK
1   Jack    21
3   Tom 19
4   Lily    28
5   Will    20
6   lss 22
7   zs  25

sort by 语法

hive> set mapred.reduce.tasks=;
hive> select * from recommend.test_tb order by userid;

distribute by 语法

Cluster by 语法

hive> select * from recommend.test_tb distribute by userid sort by userid;
hive> select * from recommend.test_tb cluster by userid;
上一篇下一篇

猜你喜欢

热点阅读