尚硅谷大数据技术之电信客服

2018-12-27  本文已影响19人  尚硅谷教育

3.4.5 最终预览

查询人通话时长与通话次数统计大概如下所示:

折线图如图8****所示:

image.png
image.png

统一展示如图9所示:


image.png

3.5 定时任务

新的数据每天都会产生,所以我们每天都需要更新离线的分析结果,所以此时我们可以用各种各样的定时任务调度工具来完成此操作。此例我们使用crontab来执行该操作。

1) 编写任务脚本:analysis.sh

|

!/bin/bash

/home/admin/modules/cdh/hadoop-2.5.0-cdh5.3.6/bin/yarn jar ~/softwares/jars/ct_analysis-1.0-SNAPSHOT.jar com.atguigu.analysis.runner.CountDurationRunner -libjars /home/admin/modules/cdh/hadoop-2.5.0-cdh5.3.6/lib/*

|

2) 制定crontab****任务

|

.------------------------------------------minute(0~59)

| .----------------------------------------hours(0~23)

| | .--------------------------------------day of month(1~31)

| | | .------------------------------------month(1~12)

| | | | .----------------------------------day of week(0~6)

| | | | | .--------------------------------command

| | | | | |

| | | | | |

0 0 * * * /home/admin/call/analysis.sh

|

3) 考虑数据处理手段是否安全

a、定时任务统计结果是否会重复

b、定时任务处理的数据是否全面

本教程由尚硅谷教育大数据研究院出品,如需转载请注明来源,欢迎大家关注尚硅谷公众号(atguigu)了解更多。

上一篇下一篇

猜你喜欢

热点阅读