大数据入门篇-朝阳医院2016年销售数据分析
2017-08-18 本文已影响0人
十三学僧

朝阳医院2016年销售数据分析
本关学习内容:R语言第三章(知识点链接https://zhuanlan.zhihu.com/p/28610253)和第四章(知识点链接https://zhuanlan.zhihu.com/p/28610422),简单的数据处理和分析
实践项目:根据朝阳医院2016年销售数据.xlsx分析月均消费次数,月均消费金额,客单价,消费趋势。
实践项目的:学习和使用简单的数据处理和分析,巩固和实践所学的内容,加深理解简单处理数据处理和分析的过程。
做此项目的大致流程:读取excel数据(选用openxlsx来读取)->数据预处理->数据分析;其中数据预处理包括了列名重命名,删除缺失数据,处理日期,数据类型转换,数据排序等相关知识。
下面我们就来做此项目吧!
朝阳医院2016年销售数据.xlsx部分内容如下:

一:读取excel数据
1.下载安装openxlsx包和stringr包(R语言的字符串处理包)

2.读取excel数据

二:数据预处理

列名重命名后:

三:数据分析:
业务指标1:月均消费次数
月消费次数=消费的总次数/月数
注意:同一天同一个人购买所有消费次数当算作消费一次。
本例子以社保卡号和消费时间为切入点

结果如下:


业务指标2:月均消费金额
月均消费金额=总消费金额/月份数


业务指标3:客单价pct(per customer transaction)
客单价=总消费金额/总消费次数

业务指标4:消费曲线图

本关心得:多敲代码,多练习,多做项目,才会让基础更扎实!
2017/08/18记