spark由浅入深玩转大数据首页投稿(暂停使用,暂停投稿)

Hive on Spark调优

2016-11-30  本文已影响2360人  Jeffbond

之前在Hive on SparkTPCx-BB测试时,100g的数据量要跑十几个小时,一看CPU和内存的监控,发现 POWER_TEST阶段(依次执行30个查询)CPU只用了百分之十几,也就是没有把整个集群的性能利用起来,导致跑得很慢。因此,如何调整参数,使整个集群发挥最大性能显得尤为重要。

Spark作业运行原理

spark-base-mech.jpg

详细原理见上图。我们使用spark-submit提交一个Spark作业之后,这个作业就会启动一个对应的Driver进程。根据你使用的部署模式(deploy-mode)不同,Driver进程可能在本地启动,也可能在集群中某个工作节点上启动。Driver进程本身会根据我们设置的参数,占有一定数量的内存和CPU core。而Driver进程要做的第一件事情,就是向集群管理器(可以是Spark Standalone集群,也可以是其他的资源管理集群,美团•大众点评使用的是YARN作为资源管理集群)申请运行Spark作业需要使用的资源,这里的资源指的就是Executor进程。YARN集群管理器会根据我们为Spark作业设置的资源参数,在各个工作节点上,启动一定数量的Executor进程,每个Executor进程都占有一定数量的内存和CPU core。

Spark是根据shuffle类算子来进行stage的划分。如果我们的代码中执行了某个shuffle类算子(比如reduceByKey、join等),那么就会在该算子处,划分出一个stage界限来。可以大致理解为,shuffle算子执行之前的代码会被划分为一个stage,shuffle算子执行以及之后的代码会被划分为下一个stage。因此一个stage刚开始执行的时候,它的每个task可能都会从上一个stage的task所在的节点,去通过网络传输拉取需要自己处理的所有key,然后对拉取到的所有相同的key使用我们自己编写的算子函数执行聚合操作(比如reduceByKey()算子接收的函数)。这个过程就是shuffle。

task的执行速度是跟每个Executor进程的CPU core数量有直接关系的。一个CPU core同一时间只能执行一个线程。而每个Executor进程上分配到的多个task,都是以每个task一条线程的方式,多线程并发运行的。如果CPU core数量比较充足,而且分配到的task数量比较合理,那么通常来说,可以比较快速和高效地执行完这些task线程。

以上就是Spark作业的基本运行原理的说明,大家可以结合上图来理解。理解作业基本原理,是我们进行资源参数调优的基本前提。

参数调优

了解完了Spark作业运行的基本原理之后,对资源相关的参数就容易理解了。所谓的Spark资源参数调优,其实主要就是对Spark运行过程中各个使用资源的地方,通过调节各种参数,来优化资源使用的效率,从而提升Spark作业的执行性能。以下参数就是Spark中主要的资源参数,每个参数都对应着作业运行原理中的某个部分。

num-executors/spark.executor.instances

executor-memory/spark.executor.memory

executor-cores/spark.executor.cores

driver-memory

spark.default.parallelism

spark.storage.memoryFraction

spark.shuffle.memoryFraction

调优过程

数据量:10g

屏幕快照 2016-09-29 上午10.39.00.png

可以看出:

本次调优只设置了spark.executor.memoryspark.executor.cores两个参数,没有涉及到spark.executor.instances参数,而默认的spark.executor.instances为2,也就是每个作业只用到2个executor,因此还没将性能发挥到最佳。

接下来采用100g的数据量,并且增加spark.executor.instances参数的设置。

数据量:100g

屏幕快照 2016-09-29 上午10.51.55.png

可以看出:

最后一列配置项是根据美团技术团队博客的建议设置的,可以看出性能相比我们之前自己的设置还是有一定提升的,至少该博客里建议的设置是比较通用的,因此之后我们都采取最后一列的设置来跑TPCx-BB测试。

最后来张大图展示调优前和调优后跑100g数据的对比:

调优前后100g.jpg.png

可以看出:

最后,用调优后的集群,分别跑10g、30g、100g的数据,结果如下:

10g、30g、100g.jpg.png

可以看出:

参考文献

http://tech.meituan.com/spark-tuning-basic.html

FullStackPlan

欢迎关注公众号: FullStackPlan 获取更多干货哦~

上一篇 下一篇

猜你喜欢

热点阅读