IT狗皮膏数据分析菜鸟篇大数据与云计算架构实践

数据分析第一篇 神马是数据分析

2017-01-08  本文已影响95人  田浩沛

数据的分类

统计学上把数据分为三类,分类数据,顺序数据,数值数据

分类型数据:主要是对事物的类别进行描述,比如电商网站中的品类,社交系统中用户的等级

顺序型数据:顾名思义,就是按照顺序排列的数据,这种数据也是文字的,如时间顺序,空间顺序,优先等级

数值型数据:最常见的数据类型,用数字或文字描述事物,是 数据分析的主要来源


数据分析的目的:

数据分析的目的就是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的内在规律。

数据分析的种类有三种:

1,描述性数据分析:常用对比分析法,平均分析法,交叉分析法。

平均分析法大致有三种类型:

算数平均数:算数平均法和加权算术平均法简单方便,容易受异常值影响。

几何平均数:主要用于 对比率,指数进行平均,用来计算平均发展速度,用来计算复利下的平均年利率,在变量可能为负数和零的时候,不能使用,当数据呈倍数关系或者不对称分布时适用性强。

调和平均数:也叫倒数平均数,主要是用来解决无法掌握总体单位数的情况下,只有每组的变量值和相应的标志总量,而需要得到平均数的问题,通常在遇到需要计算平均速度,平均利润,平均成本指标时使用,尤其是观测值是阶段性变异的资料。

2,探索性数据分析:相关分析法,因子分析法,回归分析法

3,验证性数据分析:同上

数据分析的作用:

三作用:现状分析,原因分析,预测分析

数据分析六部曲

明确目标

数据搜集:数据库,公开出版物,互联网,市场调查

数据处理:数据清洗,数据转化,数据提取,数据计算

数据分析:数据分析是将处理后的数据进行价值提取,高层次的分析方法也叫数据挖掘,数据挖掘侧重解决四类问题,分类,聚类,关联,预测

数据展现:饼图,柱状图,条形图,折线图,雷达图等等

报告撰写:对数据分析过程总结和呈现

数据分析常见指标

平均值,绝对数和相对数,百分比和百分点,频数与频率,比例与比率,倍数和番数,同比和环比,

上一篇 下一篇

猜你喜欢

热点阅读