flink

【精品课】Flink大数据项目实战

2019-01-21  本文已影响32人  87d0026b9d80

课程大纲

第一章:Flink核心概念与实验环境部署

Flink概述

1、阐述Flink的前世今生

2、Flink生态

3、Flink Use Cases

4、与Hadoop、Spark、Storm等横向对比

5、Flink当前的发展状况以及未来趋势

Flink初探

1.Flink 批处理案例实现

2.Flink 流处理案例实现

Flink核心概念与编程模型(一)

1、Flink架构

2、Stateful Stream Processing

3、DataStream与DataSet

4、Table & SQL

5、Flink程序基本结构

6、Flink DataFlow

Flink核心概念与编程模型(二)

1、window

2、Time

3、State

4、checkpoint与savepoint

Flink Runtime(一)1、Flink 运行时架构

2、TaskManger Slot

3、Job Managers, Task Managers, Clients

4、CoLocationGroup

5、SlotSharingGroup

6、Slots && parallelism

7、OperatorChain && Task

Flink Runtime(二)

1、Flink 部署方式介绍

2、Local

3、Standalone实验环境部署

4、Flink On Yarn简述(后续专门章节细讲)

5、Flink job启动方式

6、Job 的启动过程

7、Graph

8、Flink HA

第二章:Flink DataStream API及项目实战

Flink开发环境搭建

1、Flink Java开发环境搭建

2、Flink Scala开发环境搭建

3、依赖管理

4、Flink源代码编译

Flink编程基础

1、DataSet与DataStream

2、Flink编程基本套路

3、Lazy Evaluation

4、Specifying Keys

5、Specifying Transformation Functions

6、Supported Data Types

7、Accumulators & Counters

8、Java Lambda Expressions

DataStreaming API 概述

1、再次剖析Streaming示例程序

2、Graph

3、DataStreamContext环境

4、数据源(DataSource)

5、转化(Transformation)

6、数据输出(Sink)

7、迭代Iterations

8、执行参数

9、调试

状态与容错

1、Flink带状态编程

2、checkpoint与savepoint得细节

3、broadcast

4、State Backends

Connectors概述

1、Connector的概念(Source&Sink)

2、内置Connector

3、第三方Connector

4、自定义Connector

Connectors之KafkaFlink与Kafka集成开发实战

Operators概述Operator基本算子介绍

Operators之Windows操作

1、理解Window

2、理解Time与Watermarks

3. Window机制内部实现源码分析

4. 生产环境中window使用容易遇到的问题

Operators之Join操作

1、Window Join

2、Interval Join

Operators之Process Function介绍Low-level算子

Operators之异步IO异步IO方式访问外部数据源

Side Outputs简单阐述Side Outputs

Python API简单阐述一下Python API

Flink Streaming测试

1、Flink Streaming程序单元测试

2、Flink Streaming程序集成测试

Flink项目实战实时日志分析(上)

实时日志分析(中)

实时日志分析(下)

第三章:Flink DataSet API及实战

DataSet API 概述

1、再次剖析DataSet示例程序

2、数据源(DataSource)

3、转化(Transformation)

4、数据输出(Sink)

5、迭代操作

6、函数中操作数据对象

7、调试

8、Semantic Annotations

9、广播变量

10、分布式缓存

11、参数传递

DataSet Transformation

1、全面介绍各种常见Transformation(1)

2、全面介绍各种常见Transformation(2)

批处理中的容错机制讲述Flink批处理如何容错

迭代重点讲述增量迭代

Connectors1、内置Connectors

2、HDFS Connector

兼容Hadoop讲述如何跟Hadoop兼容,直接使用Hadoop的MR接口

DataSetUtils单独讲一下DataSetUtils工具类

基于Flink的ETL项目实践

1、需求分析

2、方案设计

3、代码实现

4、运行和优化

5、可视化

第四章:Flink扩展学习

数据类型与序列化讲述Flink独特的数据类型和序列化方式

Execution管理

1、Execution配置

2、打包

3、并行Execution

4、执行计划

5、Resart策略

Flink其他Libraries简介

1、CEP简介

2、Storm集成

3、图计算库Gelly简介

4、机器学习库简介

Flink 最佳实践讲述Flink使用过程中的一些最佳实践

第五章:Flink生产环境与部署

深入理解Flink On Yarn

1、深入讲解Flink On Yarn

2、Hadoop集成

Flink HA讲述各种运行模式下的HA

Flink容错机制大盘点盘点Flink的各种容错机制

Flink配置盘点Flink的常见配置

Flink CLI讲述Flink CLI操作

Flink SSL配置讲述Flink SSL配置

Flink中使用各种分布式文件系统讲述Flink中使用各种分布式文件系统

Flink应用及版本升级讲述如何升级Flink应用和自身的版本

第六章:Flink Metrics与监控

Flink metrics理解与使用理解metric并讲解其含义

Flink日志处理与History Server讲解

Flink如何处理日志并使用History Server

Flink checkpoint监控讲解检查点的监控

Flink延迟反压监控理解反压机制并讲解如何监控

Flink监控的RESTAPI讲解监控的API

Flink app问题剖析诊断结合TSDB讲解如何实现Flink app的问题剖析诊断

获取方式(备注Flink大数据项目实战)

上一篇 下一篇

猜你喜欢

热点阅读