大数据Hive在简书

hive学习(二)DML语句

2019-07-11  本文已影响7人  大数据阶梯之路

一、DDL语句

这篇文章DDL语句讲得很全,(文章链接:https://www.cnblogs.com/qingyunzong/p/8723271.html
SQL中的if表达式用法和流程控制用法:https://www.cnblogs.com/xuhaojun/p/9141396.html

二、DML语句

三、窗口函数

和SQL一样有sum()、count()、max()、min()、avg()等聚合函数,还有
ntile(参数):指的是根据传入的参数划分为几份,并返回每一份的序号。
row_number():指的是生成一列连续的序号,从1开始。
rank():指的是生成一列连续的序号,但和row_number()区别的是相同的值这一项都为相同的序号,下一个序号就跳过。
dense_rank():与rank()相反,下一个序号不跳过。
lag(参数1,参数2,参数3):第一个参数是排序列名,第二个参数是往后移动的开始行,第三个是没有数据时的默认值。
lead(参数1,参数2,参数3):这和lag()函数是相反的,区别是它往前移动。
first_value(参数):,参数是该列,对该列到目前为止的第一个值。
last_value(参数):参数是该列,对该列到目前为止的最后一个值。
以上窗口函数总结主要参考这篇文章:https://www.jianshu.com/p/9fda829b1ef1,看例子的话这篇文章里有,我就不重复做同样的事情了。

上一篇 下一篇

猜你喜欢

热点阅读