(20)RFM分析
一)RFM基础知识
所谓探索性分析,主要是运用一些分析方法从大量的数据中发现未知且具有价值信息的过程。
常用的探索性分析方法包括:RFM分析、聚类分析、因子分析、对应分析等。
RFM的含义:
R(Recency):客户最近一次交易时间的间隔。R值越大,表示客户交易发生的日期越久,反之则表示客户交易发生的日期越近。
F(Frequency):客户在最近一段时间内交易的次数。F值越大,表示客户交易越频繁,反之则表示客户交易不够活跃。
M(Monetary):客户在最近一段时间内交易的金额。M值越大,表示客户价值越高,反之则表示客户价值越低。
RFM分析就是根据客户活跃程度和交易金额的贡献,进行客户价值细分的一种方法。
RS:基于最近一次交易日期计算的得分,距离当前日期越近,得分越高。例如5分制。
FS:基于交易频率计算的得分,交易频率越高,得分越高。如5分制。
MS:基于交易金额计算的得分,交易金额越高,得分越高。如5分制。
RFM总分值:
RFM=RS*100+FS*10+MS*1
RFM分析的主要作用:
1)识别优质客户。可以指定个性化的沟通和营销服务,为更多的营销决策提供有力支持。
2)能够衡量客户价值和客户利润创收能力。
RFM的假设前提
假设交易的可能性:
1)最近交易过的客户 > 最近没有交易过的
2)交易频率高的客户 > 交易频率低的
3)交易金额大的客户 > 交易金额小的
二)分析实践
RFM接受的数据格式有两种:
1、交易数据:每次交易占用一行,关键变量是客户ID、交易时间、交易金额。
2、客户数据:每次交易占用一行,关键变量是客户ID、交易总金额、最近交易日期、交易总次数。
我们通常采用交易数据的格式进行分析。因为交易数据可以整理成客户数据,而客户数据无法还原成交易数据。即用交易数据的字段可以得到客户数据的字段,反之不行。
具体是“交易数据”还是“客户数据”根据数据源文件的格式而定。
【变量】:选择各个变量
【分箱化】:评分的总分是多少
【保存】:生成哪些新的变量,可以自定义名称。
【输出】:可以全部勾选,为了能全面的解读RFM分析结果。
确定后,生成了四个新的变量
崭新-得分:最后一次交易的时间间隔得分;
频率-得分:交易总次数得分;
消费金额-得分:交易总金额得分;
RFM得分:RFM得分
分析结果解读:
该图主要用来查看每个RFM汇总得分的客户数量分布是否均匀。
我们期望均匀的分布,若不均分,则应该重新考虑RFM的适用性或尝试另一种分箱方法(减少分箱数目或随机分配绑定值)
“RFM热图”是交易金额均值在RS和FS绘制的矩阵图上的图形化表示,用颜色深浅表示交易金额均值的大小,颜色越深,表示相应矩阵块内的客户交易金额均值越高。
如本例随着RS和FS的分值增大,颜色越来越深,说明客户最近一次交易时间越近、交易次数越多,其平均交易金额越高。
该图是最后一次交易时间、交易总次数、交易总金额之间的散点图。
通过散点图可以清晰直观的看到三个分析指标两两之间的关系,便于指标相关性评估。
本例中,交易总次数和交易总金额存在较为明显的线性关系,而最后一次交易时间和另外两个分析指标之间的相关性较弱。
RFM分析应用
为客户分组,即将三个指标分别分为“高”和“低”两种,高于均值的为“高”,低于均值的为“低”。
因此有三件事要做:
1)计算出各个指标得分的平均值;
2)将各个变量高于平均分的定义为“高”,低于平均分的定义为“低”;
3)根据三个变量“高”“低”的组合来定义客户类型;如“高”“高”“高”为高价值客户。
第一步,先计算各个指标的平均值
一定要勾选平均值,否则输出结果中没有“平均值”
现在我们得到了各个变量的平均分:3.33,2.99,3.01
第二步,将各个变量高于平均分值的定义为“高”,否则为“低”
按照1-2-3-4-5的步骤设置高于平均值的为“2”,也可以设置为“高”
同理去设置FS和MS
设置后结果如下:
可以在变量设置里设置标签,1代表“低”,2代表“高”,也可以在“重新编码到不同变量”里面设置时就直接定义为“高低”,而不是“1和2”
第三步:通过各个变量的高低组合,确定客户类型
第三区域:可以是公式,也可以是具体的数字,其实这里就是输出结果。
第四区域:表示满足的条件。
同理在“变量设置”里对标签就行设置就行。
也可以在“定义变量属性”里设置显示结果