02-flink数据处理架构引入

2021-06-08  本文已影响0人  yayooo

一、传统数据处理架构


传统数据处理架构-事务处理

Compute:计算层
Storage:存储层
CRM(customer relation managament): 客户关系管理系统
Order System : 订单系统
Contact Events:连接请求事件
Order Events:订单事件
Click Events:点击事件
Response:响应
Transactional DBMS:事务数据库管理系统

二、数据分析处理架构
将数据从业务数据库复制到数仓,再进行分析和查询。


分析处理架构

Transactional DBMS:事务数据库管理系统
ETL Process:抽取、转换、加载处理过程
Data Warehouse:数仓
Reports:报表
Ad-Hoc Queries:即席查询

三、流式数据计算架构(第一代流式计算架构)


有状态的流式计算

Application Logic:应用程序逻辑
Local State:本地状态
Periodic Checkpoint:周期型检查点
Remote Storage:远程存储(HDFS存储)

四、Lamda架构
使用两套系统,同时保证低延迟和结果准确。


lamda架构

Event Log:事件日志
Batch Layer:批处理层
Event Importer:事件加载
Batch Storage:批处理存储
Batch Processor:批处理器
Speed Layer:流处理层
Stream Processor:流处理器
Serving Layer:服务层
Batch Table:批处理表
Speed Table:流处理表
Query and merge results:查询或者合并结果
Application:应用
流处理层保证低延迟,批处理保证准确性,最后再服务层由用户指定查询或者合并流处理和批处理的表。

上一篇 下一篇

猜你喜欢

热点阅读