尚硅谷大数据技术之电信客服
2018-12-27 本文已影响19人
尚硅谷教育
3.4.5 最终预览
查询人通话时长与通话次数统计大概如下所示:
折线图如图8****所示:
![](https://img.haomeiwen.com/i10390889/9b13e051cb1c0e19.png)
![](https://img.haomeiwen.com/i10390889/66d700e7fd5c84ff.png)
统一展示如图9所示:
![](https://img.haomeiwen.com/i10390889/326cb68ac02d175f.png)
3.5 定时任务
新的数据每天都会产生,所以我们每天都需要更新离线的分析结果,所以此时我们可以用各种各样的定时任务调度工具来完成此操作。此例我们使用crontab来执行该操作。
1) 编写任务脚本:analysis.sh
|
!/bin/bash
/home/admin/modules/cdh/hadoop-2.5.0-cdh5.3.6/bin/yarn jar ~/softwares/jars/ct_analysis-1.0-SNAPSHOT.jar com.atguigu.analysis.runner.CountDurationRunner -libjars /home/admin/modules/cdh/hadoop-2.5.0-cdh5.3.6/lib/*
|
2) 制定crontab****任务
|
.------------------------------------------minute(0~59)
| .----------------------------------------hours(0~23)
| | .--------------------------------------day of month(1~31)
| | | .------------------------------------month(1~12)
| | | | .----------------------------------day of week(0~6)
| | | | | .--------------------------------command
| | | | | |
| | | | | |
0 0 * * * /home/admin/call/analysis.sh
|
3) 考虑数据处理手段是否安全
a、定时任务统计结果是否会重复
b、定时任务处理的数据是否全面
本教程由尚硅谷教育大数据研究院出品,如需转载请注明来源,欢迎大家关注尚硅谷公众号(atguigu)了解更多。