大数据机器学习与数据挖掘策划文案、产品经理、产品运营、营销策划

【面经】数据分析岗_面试题整理总结

2019-03-01  本文已影响17人  美美May_

偏统计理论知识

1. 扑克牌54张,平均分成2份,求这2份都有2张A的概率。
2.男生点击率增加,女生点击率增加,总体为何减少?
3. 假设检验、F检验
4.怎么向小孩子解释正态分布

(随口追问了一句小孩子的智力水平,面试官说七八岁,能数数)

偏业务思维逻辑

1. 不用任何公开参考资料,估算今年新生儿出生数量。

(一般面试中采用这种方法,即费米估计问题,可以参考《这也能想到?——巧妙解答无厘头问题》)

2. 如果次日用户留存率下降了 5%该怎么分析?
3. 卖玉米如何提高收益?价格提高多少才能获取最大收益?
4. 类比到头条的收益,头条放多少广告可以获得最大收益,不需要真的计算,只要有个思路就行。
5.APP激活量的来源渠道很多,怎样对来源渠道变化大的进行预警?
6.用户刚进来APP的时候会选择属性,怎样在保证有完整用户信息的同时让用户流失减少?

技术接受模型提出了两个主要的决定因素:
①感知的有用性(perceived usefulness),反映一个人认为使用一个具体的系统对他工作业绩提高的程度;
②感知的易用性(perceived ease of use),反映一个人认为容易使用一个具体的系统的程度。

(1)感知有用性:
a. 文案告知用户选择属性能给用户带来的好处
(2)感知易用性:
a. 关联用户第三方账号(如微博),可以冷启动阶段匹配用户更有可能选择的属性,推荐用户选择。
b. 交互性做好。
(3)使用者态度:用户对填写信息的态度
a. 这里需要允许用户跳过,后续再提醒用户填写
b. 告知用户填写的信息会受到很好的保护
(4)行为意图:用户使用APP的目的性,难以控制
(5)外部变量:如操作时间、操作环境等,这里难以控制

7.如何识别作弊用户(爬虫程序, 或者渠道伪造的假用户)
8.怎么做恶意刷单检测?
9.一个网站销售额变低,你从哪几个方面去考量?
10.用户流失的分析,新用户流失和老用户流失有什么不同?

(1)用户流失分析:

(2)新用户流失和老用户流失有什么不同:

11.GMV升了20%怎么分析?

(我噼里啪啦分析了一通面试官笑嘻嘻地告诉我是数据错了,因为面试较紧张没有意识到这个问题,现在想想真是个大坑啊)

这一题要注意,GMV流水包括取消的订单金额和退货/拒收的订单金额,还有一种原因是商家刷单然后退货,虽然GMV上去了,但是实际成交量并没有那么多。

偏代码、算法

1. 给你一个无序数组,怎么才能合理采样?

参考资料:https://blog.csdn.net/rtian001/article/details/50348999https://blog.csdn.net/jiang_zzz/article/details/53786999

2. 常用的Python库有哪些?
3. 行存储和列存储的区别。

参考:https://blog.csdn.net/qq_26091271/article/details/51778675https://www.zhihu.com/question/29380943

4.K-Means算法原理及改进,遇到异常值怎么办?评估算法的指标有哪些?
5.数据预处理过程有哪些?
6. 随机森林原理?有哪些随机方法?
7. PCA(主成分分析)
8.hive?spark?sql? nlp?
9.Linux基本命令
10.NVL函数
11.LR
12.sql中null与‘ ’的区别。
13.数据库与数据仓库的区别。
14.SQL的数据类型。
15.分类算法性能的主要评价指标。
16.数据缺失怎么办
17.GBDT(梯度提升树)

作者:稻蛙
来源:CSDN
原文:https://blog.csdn.net/u013382288/article/details/80417681
版权声明:本文为博主原创文章,转载请附上博文链接!

上一篇下一篇

猜你喜欢

热点阅读