excel数据分析项目--母婴产品分析
2020-07-06 本文已影响0人
小花数据分析
1 数据情况
数据集来源
https://tianchi.aliyun.com/dataset/dataDetail?dataId=45
数据集为母婴商品信息。包括2个excel表,表1为母婴商品购买信息,表2为用户信息。
表1信息如下:

2 分析思路
-
通过表1我们可以得知母婴产品的整体销售情况,销量好坏的商品各有哪些,以及产品在年、季度、月的销售情况,从而制定更合理的销售策略以应对这些差异。
-
通过表1关联到表2我们可以得知不同性别和年龄对不同种类母婴产品的需求情况,从而制定更适宜的生产销售计划,针对不同用户群体的推广销售计划。
3 数据预处理
对数据进行重复值(删除)、缺失值(删除、估算补全)、异常值(删除、估算补全),数据格式规范处理。
3.1 重复值
对用户编号重复值删除处理,选定用户编号列,删除重复项,扩展选定区域删除重复项(扩展选定区域可以删除相关的一整行记录)

3.2 缺失值
先通过筛选功能确定每列的缺失值,并处理(如用户编号列有缺失值的记录整行删除,购买数量的缺失值用0代替)。

通过筛选功能确定每列的异常值并处理。表2用户信息中,性别列出现异常值,可能是由于购买商品时,婴儿尚未出生,性别为未知。统一用数字2代替。
3.4 数据格式规范
利用分列将购买日期和生日转换成日期格式

4 母婴数据分析
4.1 数据透视表分析各产品季度平均销量情况
备注:由于2012年与2015年都只有半年的销售额,所以对年度销售额求季度平均销量情况进行分析。


结论一:2012-2015年间,商品28、商品50008168及商品50014815销售额位居前三
4.2 各商品在不同用户群体中的销售情况
4.2.1 vlookup函数关联母婴商品购买信息表和用户信息表,计算用户购买商品时的年龄(出生前用-1表示,其他用周岁表示),并筛选出无缺失信息用户信息




结论三:男孩商品总购买量是女孩商品总购买量的1.75倍
4.2.3 细分各商品在不同性别用户群体的销售量情况并图表呈现


4.2.4 细分各商品在不同年龄用户群体的销售量情况,并图表呈现


结论六:商品38在1-2周岁销量最高
结论七:商品50008168在出生前到2周岁销量较高,岁年龄递减
结论八:商品50014815出生前需求较大,1周岁时需求最大
结论九:商品50022520在婴儿出生前销售量最高,其他年龄段销售很少
结论十:商品122650008在各个年龄段需求皆较少