Spark 应用spark

百度天算大数据平台初体验

2017-05-18  本文已影响314人  俺是亮哥

曾经试用过主流大厂提供的大数据平台服务,仅从用户体验角度上来说,各有千秋。

百度天算控制台 腾讯大数据处理套件TBDS
通过客服提供的临时账号登陆TBDS 华为企业云控制台 阿里云数加控制台 Amazon EMR控制台

各产品的收费情况和其能提供的服务器性能、服务功能相关,收费方式多样化,可年、月、时。4台规模集群的Hadoop+Spark服务,大概3-5元/小时不等。

因为都是大厂的大数据平台产品,所以肯定都是功底深厚、面向广泛。上述描述,仅仅是个人体验,不具有通用性、不带有批判性、没有代表性。

本文仅简单介绍一下我比较喜欢的百度天算这个产品:
使用过程如下:执行WordCount应用程序,统计文本中单词词频。

集群配置页面 选择Hadoop Yarn Web UI链接
Hadoop Yarn Web UI界面
Hadoop Yarn Web UI界面

使用过程中一些小坑:

总结:
目前来看,主流大厂都是通过这种SaaS方式来提供大数据平台全托管的服务,面向一些没有数据中心、没有运维能力的中小型企业,按需部署和使用,非常的快捷。通过其详尽的产品使用指南,用户再具备一些大数据组件相关使用的知识,就可以快速的进行大数据的清洗、挖掘、分析和报告,无需为集群节点分配、部署、优化、维护投入时间。

相关链接:

上一篇 下一篇

猜你喜欢

热点阅读