大数据Hadoop和Spark哪个更重要一些?

2018-06-02  本文已影响0人  大数据05

当前有不少公司将Spark和Hadoop同步使用,从一名使用者的角度来看,Spark作为一种大数据通用的计较引擎,可能今朝尚未成熟,但有朝一日替代Hadoop并非不成能。

1. 不异的算法,Spark比Hadoop快数倍,若是是一些迭代或者要对数据频频读取的算法,Spark比Hadoop快数十倍至上百倍;

2. Spark对付数据的把持品种更多,对付一些斗劲不凡的计较需求,比如求两个集结的交集并集,Spark都有函数直接计较,而Hadoop实现如许的计较无比繁琐;

3. Spark的开发服从比Hadoop高良多。   大数据学习群:199427210

但同时也要看到,Hadoop作为一种分布式体系根本架构,在今朝的企业应用中是斗劲随意实现的,并且施行本钱较低。它的开源特征也使其较为适用。

从内容层面来讲,Spark也并非无懈可击,今朝来看Spark还有良多bug,并且可以看的质料也不多。

对付大数据的进修者来说,小编仍是建议两者都不要不放在眼里,都应理当做重点来进修,由于两者今朝在企业中的应用都是比价遍及而重要的。若是有同窗必要Hadoop和Spark质料的同窗可以私信小编。

上一篇下一篇

猜你喜欢

热点阅读