快手大数据平台浅谈

2020-04-01  本文已影响0人  寒暄_HX

本文参考InfoQ记者采访快手高级架构师,架构团队负责人赵建博的采访实录。

前言

快手大数据架构团队成立于2017年。
短短三年内就已经完成了一个万亿级规模的大数据架构体系,同时还完成了春晚红包活动。
在Hadoop的应用上,快手又有那些亮点?

问题1

能否详细给我们介绍一下快手大数据架构的发展历程,目前各个关键部分的技术选型是什么?出于什么目的?

出于目的和成本的考虑,快手的大数据架构服务大部分是使用开源系统构建的。
截止到目前为止,快手的大数据架构的发展大致分为三个阶段。

问题2

在春晚红包活动中,快手的大数据架构面临了哪些问题,做了哪些针对性的调整优化?

问题3

快手在调度系统方面有哪些值得业界借鉴的经验?

大数据架构团队针对资源调度系统 YARN 做了很多非常好的改进以及资源上的规划。

问题4

能否详细介绍一下快手在 Hadoop 方面的应用实践?Hadoop 对快手而言重点解决了什么问题?

Hadoop狭义上是指MR,HDFS,YARN三种服务。

Hadoop 是非常核心的底层基础服务,在快手大数据架构体系中占据着核心地位。

问题5

关于国内外唱衰 Hadoop 的言论,您怎么看?

最近流行的Fink,Spark,Druid,Clickhouse,他们只是对MR进行的提升和补充。
但是存储系统肯定是HDFS,资源调度系统是yarn。因为他们在各自的领域中都有了很好的实现,而且没有新兴的流行工具。
哪怕是K8S,他也是针对线上服务领域,对于离线数据处理,还是要依靠yarn。未来可以考虑将yarn和K8S整合,形成一个通用资源调度系统。

问题6

如何看待大数据架构与云架构之间的关系?类似 Hadoop 的大数据技术会在云服务的冲击下逐渐没落吗?

大数据技术不会没落,他会作为PaaS中的一部分,为客户提供大数据场景的业务快速构建能力,架构能力,一站式数据分析服务。
从这个角度来看,大数据不会落寞,随着大数据上云,就可以与云架构结合蓬勃发展。

上一篇 下一篇

猜你喜欢

热点阅读