数据分析
一、数据类型
互联网数据运营 根据运营的流程可以分为四大类,可以说无论是什么运营所要关注的数据都可以从这四个阶段思考。
1、拉新阶段:关注用户来源的类型:纯新用户(第一次注册)还是老用户(再注册);贴片广告的用户来源有多少,弹窗广告的用户来源有多少等等。
2、转化阶段:关注转化率:200个用户浏览了你的宣传页面,注册的有100人,这100人就是实现了转化,转化率为50%(=100/200);同样的除了注册转化率还有付费转化率等等。
3、活跃阶段:关注用户在产品内的活跃量,不同的产品表现形式不同。例如,贴吧:发帖量、回帖量等等;视频网站:点击量,观看量等等。
4、留存阶段:关注留存或流失的用户量。例如,第一天新增的用户有300人,300人中第二天还在活跃的有100人,第三天还在活跃的呢?第四天呢?一直类推。
用户运营只是运营的职能之一,贯穿在各种产品的运营中。用户运营所关注的数据指标,不同行业、不同平台等等都有不同的侧重点。
根据运营的平台来划分:
网站运营:
(1)流量方面需要关注:
PV(page view)访问页面产生的数据。 一个用户访问了5个页面,那么就产生了5个 PV。
UV(user view)某个特定页面的访客数。一个页面一个账号无论点进去几次,UV都是1,因为只有一个访客。
VV(visit view)针对于全站的访客数。一个账号进入一个网站,无论这个账号浏览了这个网站多少个网页,VV都是1 ,因为这个网站只有一个访客。
IP:针对于全站的网络IP数。你在家用电脑登录了这个网站,之后你表哥也用同一台电脑登陆了他的账号,访问了同一个网站,但这个时候IP还是只有1,因为你和表哥用的同一台电脑,网络的IP地址也是一个。
(2)访问方面需要关注:
跳出率:页面停留访客有300人,但是有150人不喜欢这个页面,选择离开,那么跳出率就是50%(=150/300)
二跳率:首页页面停留访客有300人,有150人觉得这个网站很喜欢,于是点击浏览下一个页面,那么二跳率就是50%(=150/300)。以此类推还有三跳率,四跳率等等。
转化率:转化到最终产品目的页面的比率。如果是电商的话,最终目的就是下单,那么就是新增用户和转化到下单页面的用户 的比率。以此类推,还有付费转率,注册转化率等等。
(3)活跃方面需要关注:
DAU(daily active user)即 日活跃用户量。
MAU(monthly active user)即 月活跃用户量。
相关的,还可以有周活跃用户量、年活跃用户量等等。
(4)转化方面需要关注:(这里的转化,单指电商运营方面。与上文转化率做区分)
成单量:用户共成了多少单
付费金额:用户共付费多少元
客单价:付费金额/成单量=客单价。这里需要的是,每单平均多少钱的数据
付费率:走到付费这一步的转化率
APP运营:
(1)新增:新增的设备数(按手机型号分);新注册的设备数(注册新用户。)
(2)活跃:活跃的设备数;活跃的用户数
(3)留存:
次日留存率:例如,第一天新增300人,第二天还登录的有150.那么次日的留存率就是50%(=150/300)。以此类推,还有三日留存率(第三日登录数/第一天新增数)……n日留存率等等。
TAD:比如,7日TAD=第一天留存量+第二天仍在留存的数量……+第七天仍在留存的数量
用于计算七天内,一台设备活跃过几天。
(4)转化:这里也特指电商,同上文网站运营里的转化。
根据运营的行业来划分:
内容型行业:关注PV,UV,V V,帖子数,页面停留时间,分享数等等
社交类行业:关注发帖量,发言数,PV,UV,活跃占比等等
电商类行业:关注销售收入,成单量,客单价等等
游戏类行业:关注活跃用户量,付费率,收入,ARPU(每用户平均收入)等等
除了运营平台和运营行业两个划分角度外,还有很多划分角度,其中用户运营所要关注的数据指标都是有不同侧重的。
二、数据分析概论
1、先了解指标跟维度的概念
城市是维度,后面的列是指标,维度永远是站着的,指标是躺着的。维度就是那一列,指标是具体值。
维度:版本,渠道,地域,终端,操作系统,时间
基础指标:注册用户数,订单量,pv,新增用户,用户启动,uv(简单的数据)
复合指标:退出率,平均停留时长,留存率,支付转化率,跳出率,平均访问深度。(数据的简单叠加分析)
举例:页面或全站跳出率=跳出访问量/全部落地访问量。
跳出:投放h5活动页面,用户点进去然后什么都没做,又退出去了,这个就是跳出。
放一张经典营销表举例
direct:直接的流量/other:不好归类的其他/referral:其他合作渠道跳转的/organic search:seo搜索词/social:社交类流量的豆瓣/display:品牌广告
拿到表应该看什么?
一、趋势:趋势发现异常点,从而发现原因。
二、对比,跟上周,甚至是上个月的同一周,去年的同一时间段去做对比。帮助确定数据是不是存在问题。
三、细分
总结:数据分析并不仅仅是看数字,分析的过程更多的是从不同维度中分析指标的潜在含义。所有的指标都是有基础指标各种加减乘除算出来的,基础指标指导埋点,复合指标更具有指导意义
数据分析师应该看什么?
从趋势观察数据
从对比中发现问题
多维度细分找出问题原因
三、数据采集概述
1、数据采集是根基,需要做到以下四点:
完备性:有点公司只有业务数据,而没有用户行为
多维度:维度多了才能满足统计的需求
及时性:不能这周的h5下周才收集数据。
准确性:最好精准统计,分析结果才更精确。
互联网数据统计发展演变史
2、数据采集的主要对象
(1)前段操作:
可视化埋点,全埋点:某事,某刻某人提交了已给订单
毛病:采集数据非常有限。
全埋点:好多代码先把数据都采集起来,全埋点只要嵌入一段代码就可以非常快速的看到效果,比较容易实现。一般采集两种,一种是pv,还有一种是点击交互。
两者都有的毛病是不能提供多维度的丰富数据
代码埋点:订单金额,商品名称,用户级别
自定义的采集属性等。
(2)后端日志
代码埋点:商品库存,商品成本
导入工具:用户风险级别
重要的数据尽量还是后端去采集。更准确,完整,灵活度更高
(3)业务数据
导入工具:进,销,存订单配送状态,售后服务信息。
做正确的事,而不是容易的事
全:多端采集,全量而非抽样
细:尽可能采集足够全面的属性和维度
准:准确的业务数据
针对不同业务需求选择不同的数据采集方案。