(1)Flink CEP复杂事件处理引擎介绍

2022-08-12  本文已影响0人  NBI大数据可视化分析

(1)简介及应用场景:
复杂事件处理(CEP)既是把不同的数据看做不同的事件,并且通过分析事件之间的关系建立起一套事件关系序列库。利用过滤,聚合,关联性,依赖,层次等技术,最终实现由简单关系产生高级事件关系。
复杂事件主要应用场景:主要用于信用卡欺诈检测、用户风险检测、设备故障检测、攻击行为分析等领域。
Flink CEP能够利用的场景较多,在实际业务场景中也有了广泛的使用案例与经验积累。比如


1.png

在可编程方面,Flink同时推出了Flink SQL CEP,开发者可以通过较为属性的SQL语法快速构建各类CEP事件组合应用。
Flink CEP原理说明:


2.png
(2)Flink CEP匹配模式介绍:
在Flink CEP中匹配模式分为严格近邻模式和宽松近邻模式。严格近邻模式的事件必须是紧密连接的,宽松近邻事件可以无需紧密连接,如下图:
3.png 4.png

(3)Flink CEP SQL语法介绍:
(3.1)Flink CEP SQL样例:

        String sql = "SELECT * " +
                "FROM CEP_SQL_3 " +
                "    MATCH_RECOGNIZE ( " +
                "        PARTITION BY symbol " +       //分组
                "        ORDER BY rowtime " +          //排序
                "        MEASURES " +                   //定义如何根据匹配成功的输入事件构造输出事件
                "            LISTAGG(CAST(e3.id as varchar),',') as ids,"+
                "            AVG(e1.price) as avgPrice,"+
//                "            START_ROW.rowtime AS start_tstamp, " +
                "            LAST(e1.rowtime) AS bottom_tstamp, " +     //第一次的事件时间为end_timestamp
                "            LAST(e3.rowtime) AS end_tstamp " +           //最新的事件时间为end_timestamp
                "        ONE ROW PER MATCH " +                                      //匹配成功输出一条
                "        AFTER MATCH  SKIP PAST LAST ROW " +                   //匹配后跳转到下一行
                "        PATTERN ( e1 e2 e3{1}) WITHIN INTERVAL '2' MINUTE" +  //定义事件组
                "        DEFINE " +                                            //定义每个事件的匹配条件     
                "            e1 AS " +
                "                e1.price = 25 , " +
                "            e2 AS " +
                "                e2.price = 18 ," +
                "            e3 AS " +
                "                e3.price = 15 " +
                "    ) MR";

(3.2)Flink CEP匹配规则:贪婪词量和勉强词量
Concatenation-像(AB)这样的模式意味着A和B之间的连接是严格的。因此,在它们之间不能存在没有映射到A或B的行。
Quantifiers-修改可以映射到模式变量的行数。

上一篇下一篇

猜你喜欢

热点阅读