数据分析入门(1)
互联网公司数据分析的应用场景
运营:用户运营(用户分类,用户生命周期),活动运营,内容运营,商品运营
产品:产品功能,产品体验,产品调研,用户需求调研
市场:商务合作效果,渠道推广效果,投入产出比
流程
需求分析——数据收集——数据清洗——数据分析——报告撰写——报告分享——投入应用,收集反馈
数据类型
定性数据(一般通过问卷调查获取)
· 分类数据:男生/女生 天气好/坏……
分类数据不能区分大小,也不可以进行算术计算
· 顺序数据:满意度评分,教育水平等级,年龄层……
顺序数据可以区分大小
定量数据(一般通过日志获取)
· 离散型:用户数,消费次数……
可加减,进行频数分析
·连续型:成绩,消费金额……
可算术运算,进行频数分析,集中趋势分析(均值,众数,中位数)&离散程度分析(标准差,方差,最大值,最小值,全距/范围)
数据收集
(1)数据埋点
UV,PV,用户数,用户停留时间,浏览页面等用户行为数据
(2)第三方数据平台
Growing IO,SimilarWeb, Google Analytics, 国家统计局网站……
(3)问卷调查
线上问卷调查,线下问卷调查 & 电话回访
数据清洗
(1)数据异常表现:空值,波动太大,不同数据源获取的数据相互矛盾
(2)数据异常原因:系统故障 & 人为因素
(3)清洗方法:删除异常值,平均值填充,通过统计计算值填充 & 不同数据源交叉验证
数据分析体系
常用数据分析指标(Key Performance Indicator)
网站分析指标:
UV(unique visitor) 独立访客数
PV (page view) 网页浏览量
VV (visit view) 访客网站的访问次数,该网站所有页面visit=page1+page2+……
IP( Internet Protocol) 独立IP数
DAU (daily active user)日活跃用户
点击率,转化率,网页停留时间,网站停留时间,跳出率,退出率等
eg:小皮用ADSL拨号上网,今天9am访问了www.universityofwarwick.co.uk下的两个网页,5pm访问了同一个网站下的五个网页,则:
PV=7,UV=1,VV=2,IP=2(ADSL拨号上网每次IP不同)
渠道分析指标:
新增用户数,用户转化率,渠道ROI(return on investment),渠道流量,渠道流量占比
活动效果指标:
活动点击率,活动参与人数,活动转化率,活动ROI
收入指标:
付费人数,转化率,订单数,客单价,GMV,复购频次,毛利率,毛利额
用户类指标:
新增用户,活跃用户,留存用户,回流用户,流失用户
用户价值指标:
用户最近一次下单时间,用户下单频次,用户消费总金额
#####通过需求分析,找到目标,把目标拆解成不同指标(一级指标,二级指标等)####
横向拆解数据体系原则:遵循MECE原则,即互相独立,完全穷尽;同一类型的数据在同一层级
纵向拆解数据体系原则:拆解的时候只能选一条主流程;主流程应该选择大多数用户的操作流程
不同类产品关注常见指标「例子」:
电商类
{GMV=流量*转化率*客单价;毛利额=流量*转化率*客单价*毛利率}
工具/社群类产品
{活跃用户数=新增活跃用户数+已有活跃用户数
二级:活跃用户数=新访客流量*新用户激活率+已有用户数*已有用户留存率}
游戏类产品
{付费收入=活跃用户数*付费率*ARPU
二级:付费收入=(新活跃用户数+留存用户数)*付费率*ARPU
三级:付费收入=(渠道流量*转化率+老用户*留存率)*付费率*ARPU}
O2O类产品
{订单完成率=已完成订单数/需求订单数
二级:(新用户订单数+老用户订单数)/(新用户需求数+老用户订单数)
常用数据分析框架(数据分析方法论)
1. QQ模型
数量(绝对数):用户数,浏览量,点击量
质量(相对数):留存率,转化率,参与率
eg:某banner活动点击量很高,但参与率低,说明可能活动能吸引用户,但是参与门槛高
2. 用户行为理论
3. 5W2H分析法
4. AARRR模型(“海盗模型”)
5. RFM模型(用户价值模型)
6. 人货场模型
常用数据分析方法
对比分析法,分组分析法,矩阵关联分析,逻辑树分析方法,漏斗分析法