商业智能BI商业智能BI那点事儿

数据分析的流程

2018-03-18  本文已影响45人  进击的yl
WX20180318-174815@2x.png

以我的数据日常为例,简单将数据分析的流程梳理一下。
数据的整个流程可以划分为

  1. 数据目的
  2. 数据获取
  3. 数据处理及认知
  4. 模型分析
  5. 数据结论及方案
  6. 数据报告

明确数据目的

提出问题是数据分析的出发点,出发点不明确的话,数据分析也像无头苍蝇。
出发点一般分为两类:验证型和探索性

获取数据样本

要想分析,必须要先有数据。数据源可以分为外部和内部两种,这里重点针对内部数据,分析得最多的一般也是内部数据。
外部数据源一般包括爬虫数据&行研数据等,外部数据一般都需要花费较大的数据清晰的精力。内部数据源一般指的是平台用户使用产品所产生的各种行为数据,以电商行业为例,用户的浏览记录,uv&pv,购买记录等。
内部数据获取及清洗一般使用 sql+excel+python的形式。

数据处理及认知

拿到sql跑完的数据可不是直接不久能用的,还要进行处理和认知,数据处理一般针对脏数据和缺失数据。
对于脏数据一般是做删除处理,比如已经注销的无效用户。另一个就是缺失值的处理,对缺失值可以进行填充或者删除。

数据认知主要是对值的分布有一个大概了解,数据是不是异常分布的。一般可以通过 算数平均值&中位数&方差等了解到。
在完成数据认知后,有的时候要再要对数据进行处理,视分析的目的而定。举个例子:在分析普通用户的购买金额转化分布时候,特大客的金额最好是要剔除的,否则将会影响一般用户的结论描述。

模型分析及结论

在模型分析阶段主要用tableau+python
常用的模型有

而且在分析的过程中,结论是一点一点明朗的。

解决方案及报告

得出了结论后,数据分析师并不能只交个结论啊,还要结合当前的业务现状对结论做出解读和方案的建议。
大家都在讲数据驱动业务,但是很多公司其实都没有做到或者做好,也很难做好。
报告的话就是可视化了基本,老板都喜欢图,直观易懂,没有人会愿意看一大堆文字。文集里也在连载可视化的文章,首选tableau,python也有很多包可以用。

做数据分析,得出结论和方案不算很难,难的是如何推动数据结果落地。


我的tableau public:yangliang的tableau public主页

上一篇 下一篇

猜你喜欢

热点阅读