玩转大数据

(二十二)大数据学习之流式计算

2019-11-23  本文已影响0人  Movle

大数据学习之流式计算

一.

1.计算分类:
批量计算、实时计算、离线计算、流式计算
2.共同点:
数据源 --> 采集数据 --> task worker --> task worker --> sink 输出
3.批量计算和流式计算的区别:
(1)处理数据粒度不一样。
批量计算每次处理一定大小的数据块。流式计算,每次处理一条记录。
(2)任务类型不一样。

(3)数据源的区别。

4.流式计算可以提供类似批量计算的功能,为什么我们还要批量计算系统?

二.storm:Storm是最早流式计算框架

1.架构图

三.Flink

1.spark的反义词
2.spark把任何东西,都看成RDD来处理。
3.Flink把任何东西,都看作流。

上一篇下一篇

猜你喜欢

热点阅读