Hive 版本 2.1.1


1) Hive 宏
2) Hive hpl/sql
3) Hive UDF

这里,我们介绍实现最简单的一种Hive 宏。


-- 创建宏
CREATE TEMPORARY MACRO macro_name([col_name col_type, ...]) expression;
-- 删除宏

如果函数不存在,DROP临时宏将返回错误,除非指定了if EXISTS。

二.Hive 宏案例

2.1 数据准备

1  -- 小学
2  -- 初中
3  -- 职业高中
4  -- 中专
5  -- 高中
6  -- 大专
7  -- 本科
8  -- 硕士
8 -- 博士

create table user_info(id int,degree_type int);
insert into user_info values (1,3);
insert into user_info values (2,1);
insert into user_info values (3,6);
insert into user_info values (4,4);
insert into user_info values (5,5);
insert into user_info values (6,9);
insert into user_info values (7,8);
insert into user_info values (8,2);
insert into user_info values (9,7);

    > select * from user_info;
user_info.id    user_info.degree_type
1       3
2       1
3       6
4       4
5       5
6       9
7       8
8       2
9       7
Time taken: 0.088 seconds, Fetched: 9 row(s)


2.2 case when实现


select id,
       case degree_type when 1 then '小学'
                        when 2 then '初中'
                        when 3 then '职业高中'
                        when 4 then '中专'
                        when 5 then '高中'
                        when 6 then '大专'
                        when 7 then '本科'
                        when 8 then '硕士'
                        when 9 then '博士'
                        else null
     end as degree 
  from user_info 


hive> select id,
    >        case degree_type when 1 then '小学'
    >                         when 2 then '初中'
    >                         when 3 then '职业高中'
    >                         when 4 then '中专'
    >                         when 5 then '高中'
    >                         when 6 then '大专'
    >                         when 7 then '本科'
    >                         when 8 then '硕士'
    >                         when 9 then '博士'
    >                         else null
    >      end as degree 
    >   from user_info ;
id      degree
1       职业高中
5       高中
6       博士
7       硕士
8       初中
2       小学
3       大专
4       中专
9       本科
Time taken: 14.239 seconds, Fetched: 9 row(s)

2.3 Hive宏实现


drop temporary macro if exists get_degree;

create temporary macro get_degree(degree_type string)
if (degree_type is not null,
   case degree_type when 1 then '小学'
                        when 2 then '初中'
                        when 3 then '职业高中'
                        when 4 then '中专'
                        when 5 then '高中'
                        when 6 then '大专'
                        when 7 then '本科'
                        when 8 then '硕士'
                        when 9 then '博士'
                        else null

select id,get_degree(degree_type) from user_info;


    > create temporary macro get_degree(degree_type string)
    > if (degree_type is not null,
    >    case degree_type when 1 then '小学'
    >                         when 2 then '初中'
    >                         when 3 then '职业高中'
    >                         when 4 then '中专'
    >                         when 5 then '高中'
    >                         when 6 then '大专'
    >                         when 7 then '本科'
    >                         when 8 then '硕士'
    >                         when 9 then '博士'
    >                         else null
    >      end,null);
Time taken: 0.032 seconds
    > select id,get_degree(degree_type) from user_info;
id      _c1
1       职业高中
5       高中
6       博士
7       硕士
8       初中
2       小学
3       大专
4       中专
9       本科
Time taken: 17.841 seconds, Fetched: 9 row(s)
hive> exit;
hive> use test;
Time taken: 1.204 seconds
hive> select id,get_degree(degree_type) from user_info;
FAILED: SemanticException [Error 10011]: Invalid function get_degree




上一篇 下一篇

