数据蛙数据分析每周作业

20181219CD项目思路分析

2018-12-20  本文已影响55人  夜希辰

第二遍,敲完七周七代码无成就感一股失落感,因为差距不会而失落。当然自己也学习到了关于消费分析非常重要的指标。也了解新的分析思路

《CD消费分析》

销量、消费金额、购买时间

1、 清洗数据,将文本型的时间格式转化为时间类型

时间转换

2、 分析字段:user_id,查看每位用户平均消费金额、购买数量

3、 字段order_amount销量:绘制每月销量折线图、销量的直方图

4、 order_products销售额:绘制每月销售额折线图、销售的直方图

5、 每月销售金额和销售数量的相关图

6、 用户CD购买数量与消费金额相关性

7、 消费时间order_dt:第一次消费时间、最后一次消费时间

df.groupby('user_id').month.min().value_counts()

df.groupby('user_id').month.max().value_counts().plot.barh()

时间数据透视表:用户每月的消费次数

df.pivot_table(index = 'user_id',columns = 'month',values = 'order_dt',aggfunc = 'count').fillna(0)

复购率:某时间窗口内消费两次以上用户在总有消费用户中占比

回流率:

8、 分析用户质量:order_amount消费金额。排序——用户累计消费金额占总消费金额百分比

排序:用户累计销量占总销量百分比cumsum

分析用户质量

9、 用户的生命周期order_dt:统计出用户第一次消费时间和最后一次消费时间的差值。查看生命周期的五位数(分布)

用户生命周期的直方图

生命周期大于0天的直方图。根据生命周期将客户分为:一般用户、普通用户、高质量用户

生命周期2次以上的五位数图、平均值

生命周期2次以上的用户

10、留存率:留存率也是消费分析领域的经典应用。它指用户在第一次消费后,有多少比率进行第二次消费。和回流率的区别是留存率倾向于计算第一次消费,并且有多个时间

用户每次消费距第一次时间的距离

每次消费距第一消费时间差值 每次消费距第一次消费时间差值

将时间差值分层

各时间段内的消费人数,数据透视表各时间段内的消费金额

各时间段消费人数消费金额 20181219CD项目思路分析

12-用户的平均购买周期

20181219CD项目思路分析 20181219CD项目思路分析

虽然学习统计学时给我们提供了分析思路,但真正的业务分析思路需要在实战中练习。以后上班,以及项目分析中要多练习实战项目多看案例。了解业务指标和思路。

回家补充思维导图

《美丽着努力着》

20181219CD项目思路分析 20181219CD项目思路分析
上一篇 下一篇

猜你喜欢

热点阅读