大数据,机器学习,人工智能机器学习和人工智能入门数据结构和算法分析

一文看懂对比分析方法

2019-07-01  本文已影响4人  猴子数据分析

1.什么是对比分析方法?有什么用?

对比分析方法在我们生活中经常遇到。女友天天对我进行灵魂拷问:我和对面那个女孩谁胖?这就是对比分析方法。

女友通过对比分析方法来判断自己体重是不是出了问题。在数据分析中,我们通过对比分析方法,来追踪业务是否有问题。比如,我的微信公众号日活跃率是4%,你说是高,还是低?这个日活跃率有问题吗?

这时候,就需要用对比分析方法来追踪业务是不是有问题,问题严不严重。

正所谓,没有对比就没有好坏(伤害)。

2.如何进行对比呢?

给出下面这4个图,你能得出什么信息?

不知道和谁比,得出的结论都是错误的。如果知道和谁比,才知道对比的结果。

比如下面给出了红线对比,就知道销售额这个指标,和谁比(成本,目标销售额)。

和谁比,一般分为两种:和自己比,和行业比。

女友问我:我比上个月胖吗?就是和自己比

女友问我:我看起来胖吗?这时候我就要将女友和全国女生平均值来比较,判断她胖还是不胖。这是和行业比

所以,对比的时候要分清楚是和谁在比,通常分为:和自己比,和行业比。我们看下在数据分析中,如何和自己,和行业比。

1)和自己比

经验:可以是经验值或者平均值

比如这个月我的微信公众号最近平均每天用户增长100人(新关注微信公众号的人数),用户每天在增长,是不是没有问题呢?

这么看用户表面是在增长,但是发现不了问题。这时候,可以和过去每天的平均用户增长对比看下最近用户增长是下降了还是上升了。统计过去每天的平均用户增长发现是200人。

对比发现,最近虽然用户每天都在增长,但是平均每天比过去用户增长少很多,这就要找问题产生的原因是什么了。

时间:从时间上比较,最常用的是环比、同比

环比:是和上一个时间段对比,用于观察短期的数据集。例如本周和上周对比,本月和上月对比。比如2019年12月比2019年11月下降10%

同比:是与去年同一个时间段进行对比,用于观察长期的数据集。比如2019年12月比2018年12月下降10%

如果你仔细观察,环比和同比经常出现在一些报告中,比如下面的汽车销量排名

2)和行业比

遇到问题,想知道是是行业趋势,还是自身原因,就可以和行业值对比。

举个例子,我的微信公众号日活跃率是4%,这个日活跃率有问题吗?问题严重吗?

这时候,就可以和行业值对比。微信公众号这个行业的平均日活跃率是5%,一对比,发现我这个公众号活跃率比平均值低,是自身的问题,就需要从自身上找原因,想办法提高活跃了。

再举个例子,《2017年哔哩哔哩app研究报告》中,通过将哔哩哔哩app 30天留存率(均值为59.9%),和移动视频渗透率top10 app过去半年30日留存率(均值为56.7% )对比,凸显哔哩哔哩app 30天留存率优势。

(数据来源:《极光大数据:2017年哔哩哔哩app研究报告》

https://www.afenxi.com/48368.html)

3.如何应用?

遇到问题,我们通常用3步来分析:

第1步,明确数据

第2步,分析原因

第3步,给出建议

下面我们通过一个面试题来看下,在第1步中如何使用对比分析方来“明确数据”。

解读日报里数据的波度是数据分析的基本功,在面试中会经常考。日报解读问题,通常会给一个表格。表格里是一家公司APP一周每天活跃率,老板交给你以下任务:

1)从数据中你看到了什么问题?你觉得背后的原因是什么?

2)提出一个有效的运营改进计划

遇到这类问题,需要先对数据进行可视化。在纸上画出折线图,就可以看出数据随着时间变化的趋势了。

根据这个表格,我们可以绘制出折线图,看下数据随着时间变化的趋势。

接下来分析的思路是什么呢?

第1步:明确数据可以拆解成2个子问题:1)明确数据来源和准确性2)业务指标理解

第1个子问题:明确数据来源和准确性

可以从时间、地点、数据来源来确认

不管是面试,还是实际工作中,你都可以通过以向相关人员提问的方式来沟通清楚:

1)时间:这是哪个时间范围的数据?

2)地点:这是哪个地区的数据?

3)数据来源:数据来自哪个部门?是否核对过数据没有问题?

这里假设通过向提问,我们明确了数据来源和准确性:

从时间来看,所给的数据时间范围是最近一周的数据

从地点来看,这是针对app内所有用户的数据,不是特指某个地区的用户

从数据来源看,数据是运营部门给的,核对过没有问题

第2个子问题:业务指标理解

从指标含义,和谁比两个子问题弄清楚业务指标

1)指标含义

通过提问了解清楚业务指标的含义。在这个案例里给的指标是日活跃用户率,可以这样问:

活跃用户是怎么定义的?

是指一天之内登陆了app算活跃用户?还是打开使用了app里哪个功能算活跃用户?

2)和谁比(对比分析方法)

当面试题中有提到有“高、低 、大、小”等字,比如面试官说“销量较低”,要问清楚和谁比。

对于日报解读问题,要问面试官往前几周的数据是怎样的?这样可以从整体上看出数据一个较长时间范围内是怎样变化的。给的这周数据和往前几周的数据对比,可以看出数据变化是行业规律,还是真的有问题。

比如你可以这样问面试官:

前几周的数据是怎样的,想和这周数据进行比较,看出数据随着时间范围的变化情况是怎样的。

这时候面试官会给你前几周的数据,假如是下面图片中的情况:

这样本周数据就可以和前几周的数据来对比分析,发现只有本周数据出现断崖式下跌,说明是个问题。

4.总结

1)对比分析方法用于追踪业务是否有问题

2)如何进行对比分析?

和自己比,和行业比

3)如何应用?

遇到问题,我们通常用3步来分析:

第1步,明确数据

第2步,分析原因

第3步,给出建议

第1步:明确数据可以拆解成2个子问题:1)明确数据来源和准确性2)业务指标理解

第1个子问题:明确数据来源和准确性

可以从时间、地点、数据来源来确认

不管是面试,还是实际工作中,你都可以通过以向相关人员提问的方式来沟通清楚:

时间:这是哪个时间范围的数据?

地点:这是哪个地区的数据?

数据来源:数据来自哪个部门?是否核对过数据没有问题?

这里假设通过向提问,我们明确了数据来源和准确性:

从时间来看,所给的数据时间范围是最近一周的数据

从地点来看,这是针对app内所有用户的数据,不是特指某个地区的用户

从数据来源看,数据是运营部门给的,核对过没有问题

第2个子问题:业务指标理解

从指标含义,和谁比两个子问题弄清楚业务指标

指标含义

通过提问了解清楚业务指标的含义。在这个案例里给的指标是日活跃用户率,可以这样问:

活跃用户是怎么定义的?

是指一天之内登陆了app算活跃用户?还是打开使用了app里哪个功能算活跃用户?

和谁比(对比分析方法)

当面试题中有提到有“高、低 、大、小”等字,比如面试官说“销量较低”,要问清楚和谁比。

对于日报解读问题,要问面试官往前几周的数据是怎样的?这样可以从整体上看出数据一个较长时间范围内是怎样变化的。给的这周数据和往前几周的数据对比,可以看出数据变化是行业规律,还是真的有问题。

比如你可以这样问面试官:

前几周的数据是怎样的,想和这周数据进行比较,看出数据随着时间范围的变化情况是怎样的。

推荐:如何用最短的时间找到初级数据分析师工作?

上一篇下一篇

猜你喜欢

热点阅读