第一章 初识flink - 大数据处理引擎 Apache Fli

2020-06-19  本文已影响0人  0人间四月天O

flink发展历史

在 2008 年,Flink 的前身已经是柏林理工大学一个研究性项目, 在 2014 被 Apache 孵化器所接受,然后迅速地成为了 ASF(Apache Software Foundation)的顶级项目之一

Flink 是一个针对流数据和批数据的分布式处理引擎。它主要是由 Java 代码实现。目前主要还是依靠开源社区的贡献而发展。对 Flink 而言,其所要处理的主要场景就是流数据,批数据只是流数据的一个极限特例而已。再换句话说,Flink 会把所有任务当成流来处理,这也是其最大的特点。

flink架构介绍

从部署上讲,Flink支持三种模式 :

两种应用程序接口:

当程序在编译时,生成JobGraph。编译完成后,根据API的不同,优化器(批或流)会生成不同的执行计划。根据部署方式的不同,优化后的JobGraph被提交给了executors去执行。

image.png

flink作业调度模型

如图所示,Client、JobManager 和 TaskManager。
Client 用来提交任务给 JobManager,JobManager 分发任务给 TaskManager 去执行,然后 TaskManager 会心跳的汇报任务状态。

image.png

flink框架特性

上一篇 下一篇

猜你喜欢

热点阅读