数据分析思维

天猫店铺分析

2020-12-23  本文已影响0人  让数据告诉你

一、数据源详情 本数据的数据源:

https://www.kesci.com/mw/dataset/5ee9ea4ce5f796002c2af616/file

数据源由7个字段,经查看和分析,可知各字段的含义与关系如下:
1)订单编号:括号购买商品的下单编号;
2)总金额:客户下单的总金额(包括未支付和退款金额);
3)买家实际支付金额:客户实际支付的金额,= 总金额 - 退款金额(在已付款的情况下)。客户未付款时金额为0;
4)收货地址:客户所在的省份;
5)订单创建时间:客户下单时间;
6)订单付款时间:客户付款时间(客户未付款则为空值);
7)退款金额:客户付款后申请退款的金额(由部分退款的情况)。如果未付款,退款金额为0

数据集

二、分析思路

当我们拿到数据的时候,应先界定问题,然后才是展开分析。从宏观的角度,可以将企业运作中可能遇到的问题大致分为四类:经营问题、运营问题、产品问题、战略&决策问题。所以,大致的框架可以从这四个方面提出问题,进而分析、解决。 本案例的数据集只涉及到金额和时间的问题,没有产品方面的相关信息,因此我们的思路可以从经营运营的方面进行思考。 数据集的二月份的数据,假设现在是三月份,而且你是数据集的天猫店铺负责人,你想回顾一下二月份的经营情况,你会想知道哪些信息?

思路:先进行整体数据的描述性分析,可以从以下角度入手:(1)月总收入;(2)随时间变化,收入的变化趋势;(3)收入主要来自哪些省份。

可视化仪表板:


店铺2月订单总览 各省订单情况

仪表板下载地址:
https://public.tableau.com/profile/.6213#!/

二月份的整体交易情况(数据需要进行清洗):

1)客户下单的金额约为300万元,但是实际的付款金额约为190万元,实际付款率为64%左右(下单到付款转化率为87.4%,付款到实际成交(没退款)的比例为74.8%),付款后退款的比例达到总下单金额的近20%。(这里的销售收入和转化率,退货率与去年同比或者上个月环比,是正常情况吗?没有相关数据,这里暂时不展开分析。) ;
2)店铺的件均金额只有107元,应该是属于日常消费品或者是零食类的产品概率比较大;

销售趋势情况:

1)由于年初受到疫情情况的影响,而且很多企业都延迟上班时间,由于大部分生活消费都在城里,回去之后就较少购物消费,因此在复工复产之前的一段时间,销量都比较低,一天只有两三万的销售额;
2)在10号(8号是元宵节,过后第二天)之后,16号之前,每天的销售额就只有几十块几百块,应该是这几天是此店铺的人员集体休年假,休假时间与正常春节放假时间错开
3)在17号之后,连续十来天的时间,成交金额比2月出提高了好几倍(最高一天销量大道理十多倍),而且下单之后的支付转化率和实际成交转化率也比月初的时候提高很多,而且都是稳定在一个水平上的,但是由于观察的数据期间较短,并不能确定背后的真实原因
(可能的原因:
1.店铺休假之后进行广告投放或者优惠促销活动,活动效果较为明显,销量也极速提高,在十天左右达到峰值;
2.店铺日常的销量和销售转化率都比较高,只是在2月初因为过年春节和疫情的影响,导致销售受到很大的影响,复工复产之后的销售逐步趋于稳定,但是第一种原因的可能性较大,因为销量的斜率较大,一般是短时间的刺激方案造成的,但是店铺的日常销量和支付转化率应该也是会比月初的高一些,做活动的目的是想以较短的时间恢复店铺的正常经营,然后顺便去库存把年前的存货促销卖出去以免占有资金成本)

4)如果是因促销或者广告的方式提高销量和销售额的,那么加上店铺的客单价进行分析,说明店铺经营的大概率是价格敏感性的商品
5)10号到15号期间由于销量只有几十几百,因此此期间的支付转化率和成交转化率波动较大(有33%也有100%),这个数据由于每天可能就一两笔的单子,样本数量太少,期间的数据没有太大的参考意义;
6)点击每日下单-付款-成交转化率,还能查看到下单客户的下单时间与支付时间间隔,可以查看到下单后85%以上的客户都会在3小时内付款(更多的是一小时内就付款了),只有寥寥无几的客户会在超过3小时后才付款,而且如果一些客户超过了24小时扔未付款,那么就说明这些客户基本上都不会付款了(也就是说付款时效性要控制在3小时内,最好说控制在一小时内,如果客户下单后没有在一小时内及时付款,就要采用推送或者提醒的方式让客户及时付款以提高客户的付款转化率);

各省的销售情况:

1)各省销售的金额与订单转化率方面,经济发展较好的省份会比西部的经济发展较为落后的省份好一些;
2)偏远地区的订单转化率会低一些(可能是那些地区整体的需求量比较低,而且没有包邮?)
3)在下单未支付维度上,广东和山东的表现比较“亮眼”一些,未支付的订单比例都比较高,广东方面可能是外来打工的人口比较多,对价格的敏感度会更高一些(可能不想买了?或者是找到更便宜的了?),山东由于情况不是很熟悉,也缺少更多的信息,无法做进一步的分析;
4)店铺的订单数量与销售金额之间也不符合帕累托定律(另外省份与销售额也不符合这一关系),因此也可以辅证销售趋势分析的3),店铺的产品应该是面向大众的价格敏感性产品
5)其中湖北的销量较低,应该是在疫情期间影响导致的,具体的需要有更多的数据进行对比分析。

总结:

由于数据集只有有限的时间区间和有限的字段,因此只能在时间和金额两个方面上进行大概的分析,如果要更进一步的验证分析结果,则需要有更长的时间数据或者更多维度的数据,当然了,还要对店铺的实际经营情况(销售品类、人员情况、促销情况等等方面)进行综合分析才能得出一个好的可落地的分析结果或者运营改进方案。

上一篇下一篇

猜你喜欢

热点阅读