MapReduce简单练习

2018-02-05  本文已影响0人  发光如星_275d
搭好了Hadoop环境,编写了个简单的WordCount程序,接下来,写几个MapReduce程序,看看MapReduce编程究竟怎么个用法

案例1 广告数据统计

数据格式:

11  xiaoming    1   20171224
11  xiaofang    1   20171224
11  xiaofang    2   20171224
11  xiaoshan    1   20171224
11  xiaoli  1   20171224
12  zhangsan    1   20171224
12  lisi    1   20171224
31  wangwu  1   20171224
31  mazi    1   20171224
12  daming  1   20171224
11  xiaoming    1   20171224
11  xiaofang    1   20171224
11  xiaofang    2   20171224
11  xiaoshan    1   20171224
11  xiaoli  1   20171224
12  zhangsan    1   20171224
12  wangwang    1   20171224
31  xuebing 1   20171224

地域编码+用户编号+浏览类型+日期

名词解释:
需求一:按天统计曝光量,按照曝光量升序和降序排列
需求二:对前一天产生的数据按地区统计曝光量、点击量、点击率
需求三:一批评分数据,数据样本如下
xiaoming    18  female  50

姓名 + 年龄 + 性别 + 评分

在MapReduce执行也可以设置一些参数来优化任务效果

上一篇 下一篇

猜你喜欢

热点阅读