浅谈指标

2020-08-30  本文已影响0人  秋夜雨凉

前言

在日常工作中,数据同学经常会遇到以下问题

产品:为什么A页面的数据和B页面的数据对不上

数据:我去看看

一段时间后.....

数据:A页面数据是来自于AA表,计算逻辑是AAA,且没有包含AAA状态数据;而B页面是来自于BB表,计算逻辑完全不同。所以他们虽然名称相同,但其实数据并不一样。

产品:......

亦或是

数据:同一个指标在多个项目里用到,但A同学从A表取了数据;B同学从B表取了数据。我应该从哪个表取呢?如果这个指标的逻辑修改了,那这两个表应该怎么修改呢?新增一个指标,如何确认它的定义呢?

如果大家经常遇到上述类似问题,说明需要一个“数据字典”或者“指标库”来对指标的定义进行规范化和维护。

本文将会对指标进行初步介绍,并就如何规范指标进行深入讨论。

什么是指标

我们经常听到以下类似的对话:

”很多用户都对我们产品不满意。“

“感觉我们线下门店都没几个人了。”

“小程序感觉都没几个人看。”

这些不准确、具体的话,我们平时说说倒是无妨——毕竟具体的消息需要一定的成本。但是在工作中如果还是这个态度的话,恐怕就不太合适了。如果每个项目、活动连每天多少用户数、花多少钱赚多少钱都说不明白,那这个项目想来也没什么价值。

指标,就是对抗这种不确定的描述。

我们先来看百度百科中指标的定义

指标,是说明总体数量特征的概念及其数值的综合,故又称为综合指标。在实际的统计工作和统计理论研究中,往往直接将说明总体数量特征的概念称为指标。

简单的说,指标是衡量目标的方法,它为了衡量某个东西而存在。我们常说的日活、成本、利润、收入等,都是指标。

将刚才的话运用指标重新编辑下:

“据问卷抽样统计,60%的用户都对我们产品持负面意见。”

“近一个月线下门店的客流量同比下降30%,环比下降40;每小时客流量甚至不到10人。”

“近一周小程序的DAU不到200”

是不是显得准确了很多?

下面我们进一步介绍指标的构成

指标的构成

我们可以简单的分为3类:自身属性、业务和技术。

指标的构成

属性

业务

技术

我们用DAU(日活跃用户数)来举一个例子

属性
英文名 DAU
中文名 日活跃用户数
计量单位
所属类型 基础指标
度量类型 半可加度量
业务域 小程序
业务过程 用户启动小程序
可分析的维度 启动时间、用户、渠道等
业务意义 反应了小程序的运营情况
计算公式 根据用户ID去重
产生系统 埋点
所在库表 XX.XX

是不是顿时清晰了很多?

指标的特点

结果指标和过程指标

结果性指标,比如电商场景下的 GMV 或订单量,它通常是业务漏斗的底部,是一个不可更改的、后验性的指标。

过程性指标,可以简单理解为我到达这个结果之前经过的路径,以及通过这个路径去衡量转化好坏的过程,它是可干预的,而且通常是“用户行为”。

绝对指标和相对指标

绝对指标:是指统计量的绝对值,用于反映规模、大小的量级指标,如活跃用户数。

相对指标:是指统计量的比率值,用于反映程度、质量的健康水平指标,如人均使用时长相对指标是由绝对指标通过计算得来。

可以说绝对指标是相对指标的基础,而相对指标常常蕴含着更大的信息量,两者相辅而成才能更好的分析。

先导性指标和滞后性指标

这里主要根据是在用户的关键行为(例如用户下单支付)前还是后来判定。

虚荣指标

虚荣指标指的是看起来很吊但仔细想想并没有卵用的指标,例如总用户数——你知道总用户数又有什么用呢?你需要的是用户的新增、质量、活跃。而不是它总共多少人。

指标与相关概念

Data Science 中,指标有很多相关的定义,以下介绍部分:

指标和度量

指标是度量,但度量不全是指标。

在数据中,度量更多是相比维度的一个连续性数值;可以说我们常说的指标都是度量。

例如某个员工在今年剩余的年假天数,这毫无疑问是个度量,但要作为一个指标实在是有点牵强。

指标和维度

单一的指标没有任何意义,至少需要有一个维度以上的对比才能产生价值,且只有放在同一个维度下对比才有意义

指标与指标体系

一个问题,往往有很多方面,只用一个指标不能充分说明问题。这就需要一组相关联的指标来描述,这就是数据指标体系。笔者会在后续进行详细深入的介绍。

上一篇下一篇

猜你喜欢

热点阅读