数据埋点和指标字典
数据埋点
数据埋点是一种常用的数据采集方法,埋点是数据的来源,采集数据以帮助业务人员分析网站或者app的使用情况,用户行为习惯等,是后续建立用户画像,用户行为路径等数据产品的基础。
一、埋点方式
前端的埋点方式主要分为代码埋点,可视化埋点,无埋点。
1.代码埋点:由工程师在程序中实现,通过触发某动作后自动发送数据。优点:灵活性强,可以控制发送时机和发送方式。缺点:人力成本高,需要研发工程师手工开发程序,有时候还要依赖APP发版生效。
2.可视化埋点:以前端可视化的方式记录前端设置页面元素与对其的操作关系,然后以后端截屏的方式统计数据。优点:简单,方便,能快速埋点。缺点:比较受限,上报行为信息有限。
3.无埋点:绑定页面的各个控件,当事件触发时就会调用相关接口上报数据。优点:不需要埋点,方便,快捷,省事。缺点:传输数据量比较大,需要消耗一定的数据存储资源。
结合客户端前端埋点和服务器后端埋点相结合的方式。
二、埋点事件
主要的埋点事件分为点击事件,曝光事件和页面停留时长三类。
1.点击事件:用户每点击页面上一个按钮都会记录一次数据。
2.曝光事件:当用户成功进入一个页面时记录一次数据,当刷新一次页面时也会记录一次数据,如果通过手机home键切换出去,则不会记录,因为已经脱离了app,此处的记录也没有太大的分析价值。
3.页面停留时间:记录用户在一个页面停留的时间,可以通过记录用户进入页面的时间t1和离开页面的时间t2来计算。
三、数据埋点实例
现在app端的数据埋点一般采用Key-Value形式,Key表示某个事件,Value代表对应的值,一个Key可以对应多个Value。
在埋点过程中,同种属性的多个事件要命名成一个埋点事件ID,并以Key-Value的方式进行区分。不同属性的多个事件应该命名成多个埋点ID,此时也尽量不用Key-Value的形式埋点。
两种埋点方案:
A:每个埋点代表一个事件
这种方法看上去可以达到目的,但随着活动投放的入口越来越多,每增加一个入口,就要不断增加事件ID,这样不但工作量会越来越大,而且后期维护成本和数据处理成本都会很高。
B:采用Key字段表示以后业务分析时的维度,使用Vaule字段表示在不同维度下对应的维度唯一值。
通过梳理把同属性的埋点事件用一个总ID表示,结合Key-Value细分 不同维度下的不同参数,方便日后数据分析。
优点:
1.维护成本低,更加简单高效,新增时只需要在更新埋点文档时加一个Value参数即可。
2.易理解,减少沟通成本,提高其他业务人员、数据分析师根据埋点日志进行查询和分析的效率。
3.扩展性好,对未来上线新活动或者业务调整等更加灵活,很容易在原有基础上扩展。
指标字典
指标字典是业务数据标准化的基础,目的是对指标进行统一管理,方便共享达成对业务指标的共识,并统一修改和维护。指标字典可以更新在excel或wiki中。如果有足够多的的资源,那么开发指标管理模块可以放在数据管理系统再配合血缘关系,就方便追踪数据流转了。
一、设计指标字典的目的:
1.规范维度和量度命名,命名规则要明确,通用,易懂。
2.对维度或量度统一计算口径,避免歧义。
3.涵盖尽可能多的关注的核心维度和量度,以此为基础推动数据建设,确保指标字典里覆盖的维度都可区分、指标都可统计。
4.基于指标字典,将核心维度和量度注入元数据中心,接入指标提取工具,后续实现不需要写SQL语句即可完成自助查询及分析需求。
二、指标,量度,维度的概念
指标
定义:衡量目标的方法。
构成要素:维度+汇总方式+量度
(1)维度回答从哪些角度去衡量的问题
(2)汇总方式回答用哪些方法去衡量问题
(3)量度回答目标是什么问题
量度
定义:物理测定,通常用数字+计量单位表示,如金额,份额,次数等。
维度:
看待事物的视角与方向。
三、指标的分类
1.基础指标
例如:“团购交易额”,作为一个基于单纯实体的属性的简单计算,它没有更上游的指标了,或者说它的父指标是它自身。我们称这样的指标为基础指标。
2.普通指标
所谓普通指标,即在单一父指标的基础上通过一些维度上面的取值限定可以定义的指标。
例如,团购PC首次购买用户数 [限制条件:团购订单.下单平台(二)=PC]
3.计算指标
可以在若干个注册指标之上通过四则运算、排序、累计或汇总定义出的指标我们称做计算指标。
四、指标字典的建立方法
量度维度都考虑好了,在构建一个指标字典时应该考虑哪些要素呢?如下表格为你提供一个参考:
让我们来看一个指标字典维度示例:
再来看一个指标字典量度示例:
通过以上步骤和方法,相信你应该可以根据业务,建议一个指标字典了。