数据仓库:数据仓库技术选型及方案设计

2020-11-25  本文已影响0人  dex0423

1. 大数据技术生态

1.1. 大数据技术生态体系图

大数据技术生态体系.png

1.2. 数据流程图

未命名文件 (1).png

1.3. 大数据框架

1.4. 服务器

需要根据 业务场景、集群规模 综合考虑。

1.5. 数据存储

1.6. 数据采集传输:

1.7. 数据计算


离线计算:处理非实时问题,比如用于统计日活、周活、月活等;


实时计算:处理实时数据,比如天猫双十一实时数据计算;


1.8. 数据查询

1.9. 数据可视化

1.10. 任务调度

1.11. 集群监控

1.12. 元数据管理

1.13. 数据质量监控

1.14. 数据平台和配置

2. 技术选型考虑因素

3. 集群规模参考值

日数据量:

日存储量:

半年不扩容:

保存 3 副本:

预留 Buff:

服务器需求

注意:此方案未考虑 数仓分层 和 数据压缩

5. 服务器规划注意事项

上一篇下一篇

猜你喜欢

热点阅读