Flink简介

2019-08-23  本文已影响0人  yayooo

Flink是一个分布式处理引擎,对无界数据流和有界数据流进行\color{red}{状态}计算。

流数据(双十一)
传统数据架构是基于有限数据集的

目标:

二、行业

书:Stream Processing with Apache Flink


传统数据处理架构



CRM: 客户关系管理系统
order System : 订单系统
问题:


从传统数据库将数据进行ETL,放到数仓里面。
问题:延迟高


数据流 -》 处理逻辑 -》 本地状态 -》 周期性检查点 -》 落盘


Batch Layer 批处理(延迟)
Stream Processor 实时处理(准确性有问题)

ProcessFunction 过程函数,最底层API,啥都能干。
DataStream API
SQL/Table API 最抽象,未开发完


上一篇 下一篇

猜你喜欢

热点阅读