大数据面试1
2018-05-28 本文已影响0人
Lzs_80b5
1、自我介绍,项目介绍
2、hbase的读写流程
3、spark项目中发生了数据倾斜吗,什么情况下发生,现象是什么,怎么解决?
4、hdfs读写流程
5、scala中cache,persist,checkpoint是做什么的,有什么区别,持久化级别各自含义怎么存储
6、了解scala中的apply吗
7、手写spark core中的topn
8、伴生对象了解吗
9、sparkstreaming中的算子
10、updatestatebykey怎么使用,作用是什么