架构杂记

2020-02-24  本文已影响0人  code_solve

为什么要重新设计架构

架构分层

数据收集

不丢数据
高可用
方便接入

数据清洗

实时
高效

数据建仓

数据分析

数据展示

为什么要flume

为什么用Kafka

主要作用当然是削峰填谷,做一个缓冲作用
解耦

Spark 和 Flink的对比

根据目前的情况看起来,国内普遍对于flink比较看好,
从实际情况来看,flink也是以后的发展方向,
但是目前Spark的活跃程度远高于Flink,
很难说Spark以后的底层不会也才有flink这种方式,

目前建议 离线用Spark,
实时的话可以 尝试flink

目前熟悉Spark,对Flink不太熟悉

为什么要用Kylin

Spark1.6 和 2.x的不同

过程

  1. 为什么要升级
  2. 新的架构设计概览
  3. 各个框架概览
大数据架构设计.png
上一篇 下一篇

猜你喜欢

热点阅读