Flink编程练习(一)

2018-12-11  本文已影响0人  zealscott

Flink编程练习,NYC出租车数据

环境配置

本项目参考这里setup

由于本项目使用java编译,而源文件有scala,为了忽略scala的错误,这里需要指定scala的SDK:

54449085480

项目

数据设置

使用IDEA打开该maven项目,首先需要找到依赖的文件路径:

54448844030

可以在ExerciseBase类中找到依赖的出租车数据文件路径并修改:

54448803823

这里使用的是出租车的 event-time

Taxi Ride Cleansing

utils类中,可以找到GeoUtils,这是用来检测该GPS点数据是否在纽约市内,具体实现参考isInNYC(float lon, float lat)函数。

RideCleansingExercise

若直接运行com/dataartisans/flinktraining/exercises/datastream_java/basics/RideCleansingExercise.java,会报错,其错误是在NYCFilter中:

54448966261

这里的MissingSolutionException未定义,需要自己实现:

RideCleansingTest

RideCleansingTest中定义了该类的测试类,我们可以每个函数逐步运行:

54449137550

仔细查看,这里测试了两个函数,分别是测试指定GPS点是否在NYC中,每次将运行的结果与真实结果进行比较(assertEquals),并判断是否相等。

如何test

Revise

上一篇 下一篇

猜你喜欢

热点阅读