画图

淘宝用户行为数据分析(Mysql)

2020-03-27  本文已影响0人  对三zzzzzzz

本文结构:

本文结构.png

一、理解数据

1、总体介绍

①、数据来源:

本数据集数据来源于阿里巴巴天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46

②、数据时间:

2014年11月18日至2014年12月18日

③、数据简介:

数据集由8477名随机用户共1048575条行为数据,数据集的每一行表示一条用户行为,由用户ID、商品ID、行为类型、地理位置、商品类目ID和时间组成。

总记录1000万条,因电脑性能不足,难以处理这么多数据,故取100万条作为样本进行分析。

2、字段介绍

该数据集包括6个字段,分别为用户ID,商品ID,行为类型、地理位置、商品类目ID和时间,其中行为类型包括浏览,收藏,加入购物车,购买四种类型,分别用数字1/2/3/4代替,具体如下:


字段说明
行为类型说明

二、分析思路

1、提出问题:

本次分析的目的是想通过对淘宝用户行为数据的分析,为以下问题提供解释或改进建议:

① 、分析用户使用APP过程中的常见电商指标,了解运营现状,查看各环节的流失率,并找到需要改进的环节;

② 、研究用户在不同维度下的行为规律,了解用户行为特征,优化运营策略;

③ 、研究用户价值,针对不同价值用户进行精细化的运营,;

④ 、研究用户生命周期,针对不同周期用户采取不同的运营策略。

2、数据探索:

该数据集为电商领域的数据,包括用户,商品,商品类别,用户行为,行为地址、时间六个维度。因为是电商数据,所以得先了解相关的电商运营基础指标,指标如下:


电商数据分析基本指标体系.png

了解了电商基础运营指标后,结合本数据集看看数据能做的分析包含哪些方面:

①、基于user_id、behavior_type等字段数据可以分析PV、UV、PV/UV、跳失率、总订单量等整体运营指标;

②、基于time字段可以和behavior_type等字段,可以分析用户行为特征;

③、基于time字段极其计算字段等,结合RFM模型可以给用户价值打标签;

④、基于AARRR模型,可以分析用户生命周期,划分不同用户所处周期阶段。

3、分析思路:

可查看本文结构中的模型建立及可视化部分

三、清洗数据

导入数据:
通过数据库管理工具Navicat将数据导入Mysql本地数据库。如果觉得工具太慢,可以直接CMD命令将数据导入数据库或者其他办法。
可参考方法:
https://blog.csdn.net/L_up_up_up/article/details/89514877)#查看导入方法
https://blog.csdn.net/dvd_sun/article/details/87778577 # 解决导入太慢的问题
https://blog.csdn.net/weixin_44166997/article/details/94736499 # 查看python环境导入方法

原始数据
备注:为保护源数据,建议复制表,后续操作都在副本表里进行操作为宜。

1、选择子集

由于位置字段user_geohash存在大量空值且加密处理过,无法对该字段进行分析,故直接删除该字段,后续也不对此字段进行分析,此处直接利用Navicat工具进行删除。


删除位置后的数据集

2、列名重命名

数据集列名完整可用,故不做修改


查看字段名

3、重复值处理

SELECT *,count(*)
FROM userbehavior
GROUP BY user_id
        ,item_id
        ,behavior_type
        ,item_id
        ,time
HAVING COUNT(user_id)>1;
存在重复记录

查处的数据有重复数据,但因为行为记录最小粒度为小时,而同一个用户的同一个行为在同一个小时内是可能存在多次的,所以这里不对数据进行去重处理。

4、异常值处理

本数据集的异常值只可能存在于time字段和behavior_type,所以检查这两个字段有无异常值,具体代码如下:

#异常值检查
#行为类型
SELECT DISTINCT behavior_type
FROM userbehavior;
#时间周期
SELECT MIN(time)
      ,MAX(time)
FROM userbehavior;
行为类型 时间周期

查询结果:
没有异常值需要处理

5、缺失值处理

因为导入数据的时候都设置了NOT NULL,所以是没有缺失值的,这里可以用代码验证一下:

# 验证是否缺失值
SELECT COUNT(user_id)
      ,COUNT(item_id)
      ,COUNT(behavior_type)
      ,COUNT(item_category)
      ,COUNT(time)
FROM userbehavior;
查询验证无缺失值

确认无NULL值。

6、数据一致化处理

(1)、time列包含日期和时间,为方便后续分别针对日期和小时维度的分析,将此字段拆分成两个字段,一个记录是日期(date),一个是时间(time),代码实现过程如下:

# 1.新增一列date,用于储存日期值
ALTER TABLE userbehavior ADD COLUMN date VARCHAR(20) NOT NULL AFTER time;

#2.复制time列到date列
UPDATE userbehavior
SET date = time

#3.截取日期
UPDATE userbehavior
SET date = DATE_FORMAT(date,'%Y-%m-%d')

#4.截取时间
UPDATE userbehavior
SET time = DATE_FORMAT(time,'%H')
#备注:可以实现截取操作的方法很多,可以用时间函数也可以用字符串函数

(2)、behavior_type 列的四种行为类型分别用 1,2,3,4 表示点击、收藏、加购物车、购买四种行为,为了便于查看数据,将1,2,3,4替换为 ‘pv'、’fav‘,’cart',‘buy' ,代码实现过程如下:

# 修改behavior_type值,方便查看
#1.修改数据
UPDATE userbehavior
SET behavior_type = (CASE 
                     WHEN behavior_type =1 THEN 'pv'
                     WHEN behavior_type =2 THEN 'fav'
                     WHEN behavior_type =3 THEN 'cart'
                     WHEN behavior_type =4 THEN 'buy'
                     ELSE '其他'
                     END );
# 2.验证修改数据
SELECT DISTINCT behavior_type
FROM userbehavior
验证修改数据

验证结果:修改无误。

7、排序

这里的数据排序与否意义不大,故此环节可忽略,若后续有需要再进行排序即可。

最终清洗完后的数据为:


清洗后的最终数据

四、构建模型

1、总体运营指标:

(1)、流量指标:
①、计算页面访客数(pv)、独立访客数(uv)、人均点击数(pv/uv):
 SELECT COUNT(*) AS pv
       ,COUNT(DISTINCT user_id) AS uv
       ,COUNT(*)/COUNT(DISTINCT user_id) AS 'pv/uv'
 FROM userbehavior
 WHERE behavior_type = 'pv'
②、每日流量指标变化趋势:
SELECT date AS 日期
      ,COUNT(*) AS pv
      ,COUNT(DISTINCT user_id) AS uv
      ,COUNT(*)/COUNT(DISTINCT user_id) AS 人均页面访问数
FROM userbehavior
WHERE behavior_type = 'pv'
GROUP BY date 
ORDER BY date ASC;
日维度流量指标变化
(2)、AARRR漏斗转化率
①、按照页面访客计算漏斗转化率
SELECT behavior_type
      ,COUNT(*)
FROM userbehavior
GROUP BY behavior_type;
image.png

注释:转化率是以pv为基数计算;占比是指到达下一环节的人数占上一环节人数的比例。

②、按照独立访客计算漏斗转化率
 SELECT behavior_type
       ,COUNT(DISTINCT user_id)
FROM userbehavior
GROUP BY behavior_type
ORDER BY behavior_type DESC;

下面查询一下页面跳失率,作为初步验证:

(3)、跳失率
①、浏览页跳失率

浏览页跳失率= 只访问一次就离开的人数/总用户数(已知UV = 8477)

SELECT COUNT(DISTINCT user_id) AS '只浏览无购买'
FROM userbehavior
WHERE user_id IN (SELECT DISTINCT user_id
                  FROM userbehavior 
                  WHERE behavior_type = 'pv')
AND user_id NOT IN (SELECT DISTINCT user_id
                    FROM userbehavior
                    WHERE behavior_type = 'fav')
AND user_id NOT IN (SELECT DISTINCT user_id
                    FROM userbehavior
                    WHERE behavior_type = 'cart')
AND user_id NOT IN (SELECT DISTINCT user_id
                    FROM userbehavior
                    WHERE behavior_type = 'buy');   
②、关键页跳失率

有收藏、加购行为但无购买

SELECT COUNT(DISTINCT user_id) AS '有意向无购买'
FROM userbehavior
WHERE user_id IN (SELECT DISTINCT user_id
                  FROM userbehavior
                  WHERE behavior_type = 'fav')
  AND user_id IN (SELECT DISTINCT user_id
                  FROM userbehavior
                  WHERE behavior_type = 'cart')
AND user_id NOT IN (SELECT DISTINCT user_id
                    FROM userbehavior
                    WHERE behavior_type = 'buy');   

现象描述/分析:
浏览页跳失率为18.7%,关键页跳失率为7.5%,跳失率都不高,说明用户号停留时间较久,商品对用户比较有吸引力,这也验证了前面基于独立访客计算的用户行为漏斗转化率。但是基于浏览量的漏斗转化效率却不高,是因为什么呢,这里由于缺失数据验证,不再做进一步分析。

(4)、订单指标:
(1)、成交量
①、先看总体成交量:

用户行为类型为buy即视为一个订单

SELECT COUNT(behavior_type) AS 总成交量
FROM userbehavior
WHERE behavior_type = 'buy';
②、再看每日成交量走势
SELECT date
      ,COUNT(behavior_type) AS 总成交量
FROM userbehavior
WHERE behavior_type = 'buy'
GROUP BY date
ORDER BY date;
(2)、人均购买次数

①、先看总体

SELECT COUNT(behavior_type) AS 总订单量
      ,COUNT(DISTINCT user_id) AS 总用户数
      ,COUNT(behavior_type)/COUNT(DISTINCT user_id) 人均购买次数
FROM userbehavior
WHERE behavior_type = 'buy';
②、再看每日
SELECT date
      ,COUNT(behavior_type) AS 总订单量
      ,COUNT(DISTINCT user_id) AS 总用户数
      ,COUNT(behavior_type)/COUNT(DISTINCT user_id) 人均购买次数
FROM userbehavior
WHERE behavior_type = 'buy'
GROUP BY date
ORDER BY date;
(3)、复购率
①、总体复购率
#复购率计算
# 至少成交一单的人数 
SELECT COUNT(DISTINCT user_id)  AS 成交人数
FROM userbehavior
WHERE behavior_type = 'buy';
# 查询结果:4330

# 购买大于1次的人数 
SELECT COUNT(DISTINCT user_id) AS 复购人数
FROM(SELECT user_id
           ,COUNT(behavior_type) AS 购买次数
     FROM userbehavior
     WHERE behavior_type = 'buy'
     GROUP BY user_id) AS a
WHERE 购买次数 > 1;
# 查询结果:2295
那么是哪些商品被重复购买的次数最多?哪些用户进行了更多的重复购买呢?
②、商品品类复购排行榜:

按商品品类分组统计被购买次数,降序排列取前十观察

# 商品品类复购排行榜
SELECT item_category
      ,COUNT(behavior_type) AS 购买次数
FROM userbehavior
WHERE behavior_type = 'buy'
GROUP BY item_category
ORDER BY COUNT(behavior_type) DESC
LIMIT 10;
③、用户复购排行榜:

按用户id分组统计购买行为为buy的次数,降序排列取前十观察

SELECT user_id
      ,COUNT(behavior_type) AS 购买次数
FROM userbehavior
WHERE behavior_type = 'buy'
GROUP BY user_id
ORDER BY COUNT(behavior_type) DESC
LIMIT 10

-可视化展示:


用户购买排行榜

2、用户行为特征分析:

(1)、用户行为时间的特征:
①、按日期粒度:
SELECT date
      ,COUNT(*) AS '行为总数'
      ,SUM(CASE WHEN behavior_type = 'pv' THEN 1 ELSE 0 END) AS '点击次数'
      ,SUM(CASE WHEN behavior_type = 'fav' THEN 1 ELSE 0 END) AS '收藏次数'
      ,SUM(CASE WHEN behavior_type = 'cart' THEN 1 ELSE 0 END) AS '加购次数'
      ,SUM(CASE WHEN behavior_type = 'buy' THEN 1 ELSE 0 END) AS '购买次数'
      ,COUNT(DISTINCT user_id) AS '总用户数'
      ,COUNT(*)/COUNT(DISTINCT user_id) AS '人均行为次数'
      ,CONCAT(ROUND(SUM(CASE WHEN behavior_type = 'pv' THEN 1 ELSE 0 END)/COUNT(*)*100,2),'%') AS '点击数占比'
      ,CONCAT(ROUND(SUM(CASE WHEN behavior_type = 'buy' THEN 1 ELSE 0 END)/COUNT(*)*100,2),'%') AS '成交数占比'
FROM userbehavior
GROUP BY date
ORDER BY date;
②、按周粒度

检查样本时间范围:

# 查看日期所对应的星期数
SELECT date,DATE_FORMAT(date,'%W')
FROM userbehavior
GROUP BY date
ORDER BY date

查询结果发现:
数据集中2014-11-18到2014-11-23,2014-12-15到2014-12-18均不满一周,所以周粒度的样本采集截取2018-11-24到2014-12-14中间的三个完整周进行统计分析,具体过程如下:

SELECT DATE_FORMAT(date,'%W') AS '星期'
      ,COUNT(*) AS '行为总数'
      ,SUM(CASE WHEN behavior_type = 'pv' THEN 1 ELSE 0 END) AS '点击次数'
      ,SUM(CASE WHEN behavior_type = 'fav' THEN 1 ELSE 0 END) AS '收藏次数'
      ,SUM(CASE WHEN behavior_type = 'cart' THEN 1 ELSE 0 END) AS '加购次数'
      ,SUM(CASE WHEN behavior_type = 'buy' THEN 1 ELSE 0 END) AS '购买次数'
      ,COUNT(DISTINCT user_id) AS '总用户数'
      ,COUNT(*)/COUNT(DISTINCT user_id) AS '人均行为次数'
      ,CONCAT(ROUND(SUM(CASE WHEN behavior_type = 'pv' THEN 1 ELSE 0 END)/COUNT(*)*100,2),'%') AS '点击数占比'
      ,CONCAT(ROUND(SUM(CASE WHEN behavior_type = 'buy' THEN 1 ELSE 0 END)/COUNT(*)*100,2),'%') AS '成交数占比'
FROM userbehavior
WHERE date BETWEEN '2014-11-24' AND '2014-12-14'
GROUP BY DATE_FORMAT(date,'%W')
ORDER BY DATE_FORMAT(date,'%W');
③、按小时粒度
SELECT time
      ,COUNT(*) AS '行为总数'
      ,SUM(CASE WHEN behavior_type = 'pv' THEN 1 ELSE 0 END) AS '点击次数'
      ,SUM(CASE WHEN behavior_type = 'fav' THEN 1 ELSE 0 END) AS '收藏次数'
      ,SUM(CASE WHEN behavior_type = 'car' THEN 1 ELSE 0 END) AS '加购次数'
      ,SUM(CASE WHEN behavior_type = 'buy' THEN 1 ELSE 0 END) AS '购买次数'
      ,COUNT(DISTINCT user_id) AS '总用户数'
      ,COUNT(*)/COUNT(DISTINCT user_id) AS '人均行为次数'
      ,CONCAT(ROUND(SUM(CASE WHEN behavior_type = 'pv' THEN 1 ELSE 0 END)/COUNT(*)*100,2),'%') AS '点击数占比'
      ,CONCAT(ROUND(SUM(CASE WHEN behavior_type = 'buy' THEN 1 ELSE 0 END)/COUNT(*)*100,2),'%') AS '成交数占比'
FROM userbehavior
GROUP BY time
ORDER BY time;

分析:
现象描述:0-5点点击率下降,成交率跟着下降;9-16点,点击率下降而成家率上升;17-23点,点击率上升而成家率下降。
结论:晚间用户使用淘宝更偏向于浏览,白天尤其是中午左右的时段,购买行为的比率相对一天中最高,用户使用淘宝用于购买的目的性最强。

(2)、用户商品偏好特征:
SELECT item_id
      ,SUM(CASE WHEN behavior_type = 'pv' THEN 1 ELSE 0 END) AS '点击次数'
      ,SUM(CASE WHEN behavior_type = 'fav' THEN 1 ELSE 0 END) AS '收藏次数'
      ,SUM(CASE WHEN behavior_type = 'cart' THEN 1 ELSE 0 END) AS '加购次数'
      ,SUM(CASE WHEN behavior_type = 'buy' THEN 1 ELSE 0 END) AS '购买次数'
      ,CONCAT(ROUND(SUM(CASE WHEN behavior_type = 'buy' THEN 1 ELSE 0 END)/COUNT(behavior_type)*100,2),'%') AS '成交占比'
FROM userbehavior
GROUP BY item_category
ORDER BY SUM(CASE WHEN behavior_type = 'pv' THEN 1 ELSE 0 END) DESC ;
(3)、用户行为路径上的特征:

从AARRR漏斗转化模型来看,用户购买商品可分为如下几类过程:
直接购买
浏览后购买
浏览加购购买
浏览收藏购买
浏览收藏加购购买
下面通过建立‘购买路径’指标对购买路径特征进行分析,具体过程如下:

# 1、创建用户购买路径表视图(表结构:user_id,pv,fav,cart,buy)
CREATE VIEW 用户购买路径表 AS
SELECT *
FROM (SELECT user_id
            ,SUM(CASE WHEN behavior_type = 'pv' THEN 1 ELSE 0 END) AS '点击'
            ,SUM(CASE WHEN behavior_type = 'fav' THEN 1 ELSE  0 END) AS '收藏'
            ,SUM(CASE WHEN behavior_type = 'cart' THEN 1 ELSE  0 END) AS '加购'
            ,SUM(CASE WHEN behavior_type = 'buy' THEN 1 ELSE  0 END) AS '购买'
        FROM userbehavior
        GROUP BY user_id
                   ,item_id
                   ,date) AS 购买路径
WHERE 购买 >=1; # 大于0的原因是必须要有成交

# 2、将所有用户行为标准化(存在该类行为则标记为1,否则为0)
CREATE VIEW 用户行为标准化表 AS
SELECT user_id
      ,(CASE WHEN 点击 >=1 THEN 1 ELSE 0 END) AS 点击
      ,(CASE WHEN 收藏 >=1 THEN 1 ELSE 0 END) AS 收藏
      ,(CASE WHEN 加购 >=1 THEN 1 ELSE 0 END) AS 加购
      ,(CASE WHEN 购买 >=1 THEN 1 ELSE 0 END) AS 购买
FROM 用户购买路径表

#3、建立标准化指标表(user_id,购买路径类型)
CREATE VIEW 标准化指标表 AS
SELECT user_id
    ,CONCAT(点击,收藏,加购,购买) AS 购买路径类型
FROM (SELECT user_id
            ,(CASE WHEN 点击 >=1 THEN 1 ELSE 0 END) AS 点击
            ,(CASE WHEN 收藏 >=1 THEN 1 ELSE 0 END) AS 收藏
            ,(CASE WHEN 加购 >=1 THEN 1 ELSE 0 END) AS 加购
            ,(CASE WHEN 购买 >=1 THEN 1 ELSE 0 END) AS 购买
      FROM 用户购买路径表) AS 标准化表
GROUP BY user_id;

# 4、统计各指标用户数
SELECT 购买路径类型
      ,COUNT(DISTINCT user_id) AS 用户数
FROM 标准化指标表
GROUP BY 购买路径类型
(4)、用户复购率特征:
# 1.复购率分析
#创建视图,计算不同用户的购买次数
CREATE VIEW 用户复购次数 AS
SELECT user_id
      ,COUNT(behavior_type) AS 购买次数
FROM userbehavior
WHERE behavior_type ='buy'
GROUP BY user_id
ORDER BY 购买次数 DESC;

# 2.计算不同购买次数的用户数
SELECT 购买次数
      ,COUNT(DISTINCT user_id) AS 用户数
FROM 用户复购次数
GROUP BY 购买次数
ORDER BY 购买次数;

3、基于RFM模型分析用户价值:

(1)、RFM模型简介
image.png
(2)、分类维度及标准
image.png
(2)、实现过程

参考RFM模型,结合该数据集的字段,通过R(Recency)和F(Frequency)两个维度把客户分成四大类:

①、建立视图,统计用户R值和F值:

R统计基准日期为:2014-12-18

# 用户价值分析
# 用户id、R/F统计视图
CREATE VIEW 用户RF统计视图 AS
SELECT user_id
      ,DATEDIFF('2014-12-18',MAX(date)) AS R
      ,COUNT(behavior_type) AS F
FROM userbehavior
WHERE behavior_type = 'buy'
GROUP BY user_id;
②、给RF分组,给用户打分

A、数值分组
查看最大值和平均值,确定分组标准

SELECT MAX(R)
      ,MAX(F)
FROM 用户RF统计视图

B、为用户价值打分
将R、F分组后按照上面的标准进行打分

CREATE VIEW 用户价值打分 AS
SELECT user_id
      ,(CASE WHEN R BETWEEN 0 AND 7 THEN 4
             WHEN R BETWEEN 8 AND 15 THEN 3
             WHEN R BETWEEN 16 AND 23 THEN 2
             WHEN R BETWEEN 24 AND 30 THEN 1
             ELSE 0
             END) AS R_score
        ,(CASE WHEN F BETWEEN 1 AND 5 THEN 1
               WHEN F BETWEEN 6 AND 10 THEN 2
               WHEN F BETWEEN 11 AND 20 THEN 3
               WHEN F BETWEEN 21 AND 82 THEN 4
               ELSE 0
               END) AS F_score
FROM 用户RF统计视图;

C、计算R_score和F_score的平均值,确定评分标准
按RF的平均值打标签,然后将R/F的评分跟平均值比较,比如重要价值客户两项评分必须都高于平均分:

SELECT AVG(R_score),AVG(F_score)
FROM 用户价值打分
③、给不同价值用户贴上价值标签:
CREATE VIEW 用户标签表 AS
SELECT user_id
      ,(CASE WHEN  R_score  > 3.09 AND F_score >1.07 THEN '重要价值客户'
              WHEN R_score  > 3.09 AND F_score <= 1.07 THEN '重要保持客户'
              WHEN R_score  <= 3.09 AND F_score > 1.07 THEN '重要发展客户'
              WHEN R_score  <= 3.09 AND F_score <= 1.07 THEN '一般价值客户'
              ELSE 0
              END) AS 客户类型
FROM 用户价值打分;
④、查看不同价值用户占比情况

客户类型计数:

# 用户类型计数
SELECT 客户类型
       ,COUNT(DISTINCT user_id) AS 数量
FROM 用户标签表
GROUP BY 客户类型
⑤、现象描述/分析

对不同类型的用户实行不同的营销策略:

4、用户生命周期分析
(1)、用户生命周期简介

用户生命周期是指用户从第一次进入平台到最后彻底离开平台所经历的每一个阶段,主要可以分为五个阶段,不同阶段的用户对平台创造的价值是不一样的,不同阶段的用户特征也是不一样的。在进行精细化运营的过程中,为使用户更快的进入成熟期并且维持,用户生命周期是一个重要的课题。


用户生命周期
(2)、实现过程

结合AARRR模型对用户生命周期阶段进行划分,因为数据集没有金额,所以这里也只从R、F两个维度进行分析,具体实现过程如下:

①、指标选择
SELECT behavior_type
      ,COUNT(behavior_type)
FROM userbehavior
GROUP BY behavior_type;
②、权重计算
按AARRR漏斗计算各指标权重
③、得分计算排序
# 按用户分组计算得分和排名
CREATE VIEW 用户生命得分表 AS # 4.创建视图,作为打标签的基表
SELECT user_id
      ,得分
      ,RANK() OVER (ORDER BY 得分 DESC ) AS '排名'  #3.对分数进行排名
FROM (SELECT * 
            ,(点击次数 *0.1 +收藏次数*0.2 +加购次数*0.2 +购买次数*1  ) AS 得分  #2.计算用户活跃度得分
      FROM (SELECT user_id # 1.按用户id分组,计算每个人的行为数
                    ,SUM(CASE WHEN behavior_type = 'pv' THEN 1 ELSE 0 END) AS '点击次数'
                    ,SUM(CASE WHEN behavior_type = 'fav' THEN 1 ELSE 0 END) AS '收藏次数'
                    ,SUM(CASE WHEN behavior_type = 'cart' THEN 1 ELSE 0 END) AS '加购次数'
                    ,SUM(CASE WHEN behavior_type = 'buy' THEN 1 ELSE 0 END) AS '购买次数'
              FROM userbehavior
              GROUP BY user_id) AS 按权重计算得分
        ORDER BY 得分 DESC) AS 得分表;
④、周期划分
#给每一位用户打上周期标签
#已知总用户数8477人,按比例划分:
#成熟期:排名小于8477*20%
#成长期:排名介于8477*20%到8477*50%
#休眠期:排名介于8477*50%到8477*75%
#流失期:排名大于8477*75%
CREATE VIEW 用户生命周期最终表 AS
SELECT *
      ,(CASE WHEN 排名 < 1695 THEN '成熟期'
             WHEN 排名 >= 1695 AND 排名 < 4239 THEN '成长期'
             WHEN 排名 >= 4239 AND 排名 < 6358 THEN  '休眠期'
             WHEN 排名 >= 6358 THEN  '流失期'
                 ELSE '怎么回事'
                 END) AS 标签
FROM 用户生命得分表;
⑤、现象描述/分析

给每个用户打上标签之后,就可以根据用户所属的不同阶段,进行个性化的运营策略:
引入期:找到合适的渠道进行拉新
成长期:刺激用户快读进入成熟期
成熟期:建立积分体系维护用户
休眠期:通过运营策略刺激用户重新回到成熟期
流失期:流失用户召回

五、总结建议

通过对运营指标、用户行为、用户价值和用户生命周期的分析,可得出如下结论:

(1)、总体运营指标方面:

①、从对流量指标和订单产生效率指标分析可知,促销活动对用户各项指标的影响非常大。

②、用户行为转化率很低但跳失率却不高,这说明用户在首页进行多次点击后并未找到中意的商品,有意向-购买转化率50%,说明有过半数的加购最终也没有成交。

③、页面访客基准的转化率仅为5%和1%,而基于独立访客转化率为100%和51%,跳失率也不高,这说明商品还是符合用户需求的,只是“道路不够通畅”。

(2)、用户行为特征:

①、时间上的活跃度特征:活动日活跃平日平稳;周末活跃平日平稳;晚间活跃白天一般。

②、商品上的活跃度特征:仅购买一次的用户占47%,购买5次以内占比90%以上,说明留存率很低,结合基于独立访客的转化率来看,运营效果不好。

③、购买路径上的特征:直接购买占比58%、浏览购占比47%,用户并不会走完每一个步骤,商品品质和首页引导对销量转化非常关键。

④、复购率上的特征:总体复购率53%,可针对复购率高的商品和用户,分析其画像,提升复购,增加留存。

(3)、用户价值:

①、重要价值客户仅为6%,就是最近有消费且频次高的用户,这说明高价值用户比例少/留存低。

②、重要保持客户44%,就是那些最近买过但频率不高,比例较高,需丰富运营活动,刺激消费,让更多的人成为重要价值客户。

③、重要发展/挽回客户仅为1%,就是那些以前消费频率高但已经很久没有消费了,这说明平台流失率低,用户忠诚度较好。

(4)、用户生命周期

①、引入期:找到合适的渠道进行拉新

②、成长期:刺激用户快读进入成熟期

③、成熟期:建立积分体系维护用户

④、休眠期:通过运营策略刺激用户重新回到成熟期

⑤、流失期:流失用户召回

上一篇下一篇

猜你喜欢

热点阅读