一道百度数据分析的题目+思路

2020-09-19  本文已影响0人  Star英

题目:如果某日百度的用户检索量下降了5%,该如何分析其原因,说明思路和要点。

1.回答策略:
大致可以从以下四个角度进行阐述:
(1)明确问题是什么?(哪个指标出了问题)
(2)问题多大?(预期影响面估算)
(3)分析的目的是什么?(重大因素排查——>问题精确定位——>止损)
(4)分析的方式是什么?(从全局到细分,从常见到非常见,从严重到相对影响较小,逐层排查数据,并借助各种手段逐渐定位问题)
2.背景知识
(1)检索量是什么
一般情况下每发起一次检索请求记为一次检索,当统一用户发起多次检索时记为多个检索量,而当同一个用户在短时间内检索同一搜索词时,不重复累计。
(2)下降5%是什么概念
以google2013年给出的旧闻来看,当时google月检索量超过1000亿次,折合算日均33亿次,以2013年~2015年50%以上的增幅来看,现在google保守估计日均检索量为50亿次。由于中文检索时长的强大,百度达到这个体量也并非难事,那么下降5%意味着损失了过亿次检索量,天然的单一突发事件(如娱乐新闻等)几乎不可能造成这么大的检索量流失。
(3)检索量下降这个事情要怎么看待
无论是骤降还是平缓下降,5%的非预期性下降都是极为敏感的,所以需要第一时间作出反应,观察期不可能拖太久,所以需要迅速完成“重大因素排查——>问题精确定位——>止损”的步骤。
第一步:数据异常分析的基础层面要点有哪些?
① 全局指标分析。全局指标包含但不限于一段合理的时间段内的检索量、独立用户数、总CTR、首次点击时间、翻页率等。以上全局指标可用于排查全局性问题,比如节日、重大事件效应,另外可以发现用户行为异常以进一步缩小问题范围。
② 分渠道数据分析。主要统计多个维度不同渠道的指标,俱到可以按照引流方式、地域、浏览器、操作系统、运营商等分类。此步骤主要用于观察渠道数据是否有异常,常常可以定位到如浏览器切换默认搜索引擎、地方运营商劫持之类的问题。
③ 用户行为数据分析。在1)和2)的基础上,分析用户不同时间段、不同群体、不同需求类型下的数据情况,另外在1)的基础上,更加细致地分析则需要抽取随机(检索词),通过用户session(用户为了得到某个信息而在一段时间内连续搜索地行为)人工拍哈是否出现行为异常。此步骤主要为排查是否有事件导致用户行为异常,例如开学了,学生们都乖乖去回去上课了,可能导致娱乐类搜索量下降。
④ 搜索结果数据分析。针对搜索各类型结果做数据分析,分析结果类型统计影响面、点击率、结尾点击率等数据。此步骤主要为排查是否出现结果异常,尤其是排查是否线上出现事故。

以上数据需要在定位到原因后严格计算原因造成的检索量损失是否真的温和实际数据,比如假设认为是某节日引起的,则必须拉取同比数据对比同样该节日的情况下下降数据是否接近,如果仍有较大偏差则不能掉以轻心,需要继续排查直到数据最终符合预期为止。

第三步:除了数据之外,还有那些手段配合定位原因
① 舆情监控。舆情监控包括但不限于内部反馈渠道、微博、论坛、朋友圈等方式收集用户对百度搜索的反馈,一般来说,过亿的检索量影响是极有可能在舆情层发现问题的。
② 其他产品线监控。除了第一步④中提到的基本数据之外,实际上其他产品线监控数据也是可以协助排查问题的,例如行为异常,其他类似贴吧、视频之类的产品线可以提供佐证证据。

3.详细解答
为了分析百度检索量下降5%的原因,可以按照以下步骤进行分析。
(1)排查全局指标,排查以下因素
① 同比数据是否有同级别下降?排查是否周期性影响,如节日、重大赛事影响等。
② 环比数据特征?平稳下降还是骤降?排查突发性事件还是积累性事件。
③ 排查CTR、首点事件、翻页率等,确认是否有全局性因素导致用户数据异常。
(2)排查分渠道数据,排查以下原因:
① 是否出现个别地区大幅度下降?
② 是否出现个别运营商大幅度下降?
① 是否出现个别UA大幅度下降?
(……其他可能性不赘述)
(3)排查用户行为变化,排查以下因素
① 是否某群体使用百度的量减小?
① 是否某类需求在百度搜索减小?
① 是否某些场景下使用百度的量减小?
(……其他可能性不赘述)
(4)排查搜索结果的变化,挨个追查产品上线、下线情况,主要排查是否出现事故
(5)同时结合舆情、同类/相关产品线,进行协助分析
排查完成后,定位到某个具体原因,然后根据具体原因来考虑止损方案。

上一篇下一篇

猜你喜欢

热点阅读