数据分析在物流行业应用--客户分析
2017-05-06 本文已影响919人
数据运营python
背景
由于中国地大物博导致了中国的物流目前没有像美国一样出现物流企业的巨头,目前很多物流公司还停留在人工开单,人工记账的阶段,比较好的公司就有一个软件进行管理平时的操作,但是也只是停留作为一个工具去使用,对于每天的积累的数据没有利用起来。不管对于什么行业,客户是最重要,下面通过数据分析区分不用的客户级别。
模型
识别客户价值最广泛的模型是通过下面的三个指标去衡量:
- 最近 消费 时间 间隔( Recency):是指用户在最近的一次消费离数据进行分析的时间的间隔
- 消费 频率( Frequency):是指用户在数据分析的区间,交易的次数
- 消费 金额( Monetary):是指用户在数据分析的区间,交易的总金额
通过上面三个指标识别 出高价 值 的 客户, 简称 RFM 模型。
分析步骤
-
获取原始数据(专线一个月的客户的开单的数据)
客户名称,交易时间,交易金额 -
对数据进行处理:
(1). 最近 消费 时间 间隔( Recency)=数据统计截止时间-客户最后的交易时间
(2). 消费 频率( Frequency)=统计客户在统计时间内的交易次数
(3). 消费 金额( Monetary)= 统计客户在统计时间内的交易金额总数 -
对获取的三个数据进行标准差 标准化
结果=(原始数据-均值)/方差 -
通过k-means聚类的算法,选取5个聚类对客户进行分析。
机器学习中聚类指事先并不知道任何样本的类别标号,希望通过某种算法来把一组未知类别的样本划分成若干类别,这在机器学习中被称作 unsupervised learning (无监督学习)
分析结论
- 根据下图的分析结果:
(1) 序号为3的数据F,M指标最高,表示这些客户是交易的次数,金额是最大,这些客户已经达到饱和,所以是需要进行保持的客户
(2)序号为0的数据F,M指标次之,是需要进行重点发展的客户,上升空间比较大
(3) 序号为4的客户,各项指标都比较正常,是需要进行重点挽留客户
(4) 序号为1的客户,各项指标都是负的,为低质的客户
验证结果
根据统计结果的分类,简单的通过各个分类的客户数以及该分类的客户的金额进行验证,通过该算法可以对客户进行分类,可以针对不同的客户群体进行不同的营销策略,从而达到做大做强。
结论.png最后,打个广告
IMG_1324.JPG