20届春秋招数据分析面筋分享
更新:
秋招拿到了4个小公司:深农商、闪银奇异、中移动信息技术和中邮消费金融
秋招签了深农商,后来毁了三方
春招拿到了猿辅导,已签
---------------------------------------------------------------------
基本信息:
性别:女
学校:双非本(信管专业),211硕(应统专业)
投递公司:大概190家(有重复的公司),不全是数分
笔试+测评:大概90+
面试:21
base:武汉
面经记录:
一面挂的:浙江大华(大数据工程师)(8.19),云从科技(数据工程师)(8.29),京东(数据分析工程师)(9.2),美的(数挖)(9.17),富途(数据分析师)(9.18),哈啰(风控算法工程师)(9.19),广发卡(数据分析师)(9.20),贝贝(数据分析师)(9.20),vipkid(数据分析师)(9.24),没错一面挂概率42.8%,菜鸡本鸡
二面挂的:招银网络科技(数据研发工程师)(9.17),嘉银金科(风控管培生)(9.25),中移在线(数据分析师)(10.8)
三面挂的:顺丰(大数据分析与挖掘工程师)(9.18),产险(管培生(数统))(9.21)
流程中的:
等一面:哈啰(风控策略分析师)(善良的小哥哥把我的简历推到了别的组)
等二面:微众(数据分析(风险管理))(9.27),趣店(数据分析专员)(9.27),招商金科(数据开发)(10.14)
等结果:中邮消费金融(数据挖掘)(9.25),银联商务(数据建模)(10.11)
放弃的:华为,万科
--------------------------------------秋招不易------------------------------------
京东(数据分析工程师)(9.2)(现场)
1.Rfm模型
2.Python如何连数据库
3.system.pas(这个我可能没听清,下来查了查也不知道是啥)
4.grep是啥
5.hive的并行化操作,管道操作
6.map join
7.Python如何传参
8.漏斗模型
9.静态分区和动态分区的区别
10.问京东分为不同会员,如何从各个方面提高下单率(漏斗模型)
11.hive的字符串操作函数,窗口函数
12.一道sql问题,求出全部成绩>80的学生,可以用min(score)over(partition by sname)>80,就可以满足所有成绩>80,也可以用row_number()但是没有上面的简洁.
13.用的图表,取哪些指标,数分需要哪些核心技能,python的基础知识?
总结:小姐姐貌似不太会机器学习那些,全程问的hive的一些很基础的知识,也没问项目,这是第一个现场面,所以有点紧张,而且感觉这个很偏ETL,所以被问的很惨,基本没有答上来,数分真的太南了,要掌握这么多知识...
------------------------------------------------------------------------------------
哈啰(风控算法工程师)(9.19)(现场)
首先吹爆小哥哥的颜值,太帅了,而且虽然普通话不标准,但是也不妨碍散发的魅力...
两个问题:1.有三个字段,userid,time,(x,y),如何根据这三个字段判断他所处的位置,是工作区,住宅区还是商圈,是商圈的如何定位到是哪个商圈?
2.有n台打印机,m个query,m远大于n,query是一个接一个来的,如何判断哪台打印机是空闲状态?知道每个任务的开始和结束时间,用代码实现
总结:后来提问环节了解到他一直是用他实际工作中遇到的两个问题来考察应届生的能力,想通过这个相对公平的场景下,看大家应对一个新问题的思维方式,第一次也是最后一次遇到这样的面试官,不过算法真的要求很高,手撕代码那是必须的,所以我不敢投了...
---------------------------------------------------------------------------------
富途(数据分析师)(9.18)(现场)
1.row_number()over()的一个sql题
2.两个人轮流掷硬币,先掷到正面朝上的吃苹果,问先掷的吃到苹果的概率多大
3.美股8月比7月交易量下降了20%,分析原因
总结:这个是比较偏业务的,那些常见的数据分析方法,维度拆分等要会,感觉应该是有套路,但每次都gg.对于数分来说,不懂业务的数据分析师就是sql girl,是没有灵魂的,分析出来的东西也没有价值,结果面试出来两分钟就收到:您已进入淘汰阶段...
-----------------------------------------------------------------------------------
产险(管培生(数统))(9.21)(现场)
群面:要向企业推出一个"职业敬业险",如何精准营销和推广,有8张图表,选出两张最重要的并说明理由
形式:8人两组,先每个人发言,再两组分别讨论,选一个人出来,最后两组得到一个一致的结论,选一个人来总结
总结:这种群面形式还是第一次,题目感觉有点难,涉及图表的信息量也很大,如何在短时间内有一个清晰完整的思路还是蛮有难度的.
-----------------------------------------------------------------------------------
嘉银金科(风控管培生)(9.25)(现场)
1.怎么样能让他快速记住我(刚开始想是不是要打他一巴掌...)
2.一个如何和别人沟通才能成为领导??(可能我记错了)
3.由于实习是在风控部门下面的,细扣项目,问相关的问题
总结:技术面也有可能问一些开放问题,这种平时最好要准备一下,回答到完美,可能会比较加分,我觉得我回答的不是很好,而且明明面试官说经历和他们的很匹配,反手一个挂,这个面试官是大猪蹄子无疑了...
---------------------------------------------------------------------------------
招银网络科技(数据研发工程师)(9.17)(现场)
一面:
1.Python如何传参
2.is和==区别
3.ID3和C4.5的定义和使用场景
4.spark和hadoop有了解吗
5.讲讲推荐算法
6.什么情形下不会用决策树
7.数据不平衡怎么处理
8.流处理有了解吗
9.深拷贝和浅拷贝
总结:研发果然不适合我,感觉更考察spark和hadoop的比较基础的知识,和数分还是有很大差别的...
-------------------------------------------------------------------------------------------------------
丰巢(数据分析师)(10.10)(现场)
一面和三面类似,都是统计学和机器学习基础知识,像:
1.P值,置信区间
2.如何判断数据是否服从正态分布
3.常见的数据分布有哪些,讲讲泊松分布
4.堆排序,归并等等
5.Kmeans
6.决策树的原理
7.贝叶斯定理
8.SVM
9.运筹学的整体规划(本科有***筹学...)
10.漏斗模型画个图讲讲
总结:他们公司不太看重项目和实习经验,就看基础牢不牢,三面竟然是大佬
其他公司就基本围绕项目及其中的细节来问,也没有很难的,故不放了..
-------------------------------------------------------------------------------------------------------
猿辅导(2.18一面,2.25二三面,2.27offer)
一面(1h)
1.如何比较两个班级的成绩?A/B test,方差分析
2.泊松分布
3.假设检验的过程
提出原假设和备择,然后抽样得到样本观察值,确定使用的统计量和显著性水平,然后计算统计量的数值,并和显著性水平对应的临界值对比,最后作出相应的判断.
4.P值
5.方差分析的过程
6.如何判断异常值
7.xgb的原理
8.标准化和归一化
9.手推xgb的算法
10.sql和python题
sql:任意一门成绩在70分以上的学生名字,课程名称和分数
python:输出数组[2,3,4]的最小值
二面(30min)
1.说说你了解的随机变量分布(分离散和连续)
2.泊松分布
3.一块圆形蛋糕,蛋糕边缘有一个点,从原点出发切2刀,蛋糕分成2个扇形,求包含点的一块蛋糕的面积的期望
4.sql题:统计10.1-10.10每天做新题的人的数量,重点在每天
Select count(1) as new_num
From
(Select a.sno_id,count(distinct a.first_time) as num_day
from
(Select sno_id,ti_id,time,min(time)over(partition by sno_id,ti_id) as first_time
From paper
Where convert(time,date) between ‘20191001’ and ‘20191010’)a
Where a.time = a.first_time
Group by a.sno_id
Having num_day=10)b;
5.100万个人的百米赛跑成绩的直方图,问直方图的大概形状,你认为左尾和右尾哪个尾重更大
三面是高管面,简单聊聊
总结:小猿非常注重统计基础知识,最好把贾俊平的书好好看一遍;同时也有一些概率论方面的题,尽可能多的看面经。
.-----------------------------面经结束-----------------------------------------
总结:1.早投!早投!早投!,不要害怕提前批神仙打架,你可能连正式批都没有
2.数分确实是一个比较坑的岗位,人多坑少,可以试着投一投其他的岗,数据开发,算法,数挖,产品等等
3.菜鸡就要海投(像我一样),不要怕麻烦,有笔试的宣讲会一定要去,增加曝光率,我跑隔壁学校不下20次,线上笔试做过的我还会再做一遍,任何笔试面试的机会都不要放弃,我有10天大概每天就是早8点出门晚10点回学校,中午没有时间休息
4.面试其实很看眼缘和运气的,我之前也有那种流程走完的,但是不要我就是不要我,这两个offer基本就两三天就确定了,所以感觉到苦尽甘来
5.数分有偏技术和业务的,但是业务一定重于技术
6.吐槽vipkid面试官和银联商务面试官,不太尊重人
7.感谢秋招遇到的优秀的牛友们
8.最后要非常非常感谢我的实习公司--平安壹账通和百融云创
9.多看面经
10.不要害怕面试,抓住一切可以上岸的机会,即使是霸面也要试一下
最后祝所有小伙伴都拿到满意的offer!!!