玩转大数据大数据 爬虫Python AI Sql大数据

数据分析入门基础---统计学(笔记1,附学习资料)

2018-08-13  本文已影响10人  马小野

文章仅为统计学基础知识的学习笔记,供快速查找。如果只需要电子书及视频学习资料,拉到文尾自行提取(无密码)。

第一章 变量和图形

统计学:科学方法收集、整理、汇总、描述和分析数据资料,并在此基础上进行推断和决策的科学;

归纳统计学/统计推断:通过样本分析来给总体下结论

描述性统计学/演绎统计学:值描述和分析特定对象而不下结论或推断

变量、常量、连续变量、离散变量、连续数据、离散数据

自变量、因变量、函数、单值函数、多值函数

第二章 频数分布

数组阵列:原始数据按照数量大小升序或者降序排列,最大值与最小值的差为全距;

组距、组限、组界、组中值、直方图与频率多边形

频率分布=某一组频数/总频数

累计频数分布/累计频数表,累计频数多边形/卵形线

累计频率分布/百分率累计频数=累计频数/总频数

第三章 均值、中位数、众数及其他表示集中趋势的度量

1、平均值/集中趋势的度量:趋向落在根据数值大小排列的数据的中心

算术平均:

加权算术平均:

2、中位数:一组数根据数量大小排列后的做兼职或者两个中间值的算术平均值

3、众数:一组数出现次数最多的那个数,众数不一定存在,也不唯一

均值、中位数和众数之间的关系:

4、几何平均G

5、调和平均H

算术平均、几何平均和平均之间的关系

6、均方根RMS

第四章 标准差和其他表示利差的度量

离差/变差:数值数据围绕其平均值分布的分数与集中程度,常用的有全距、平均偏差、半内四分位数间距,10-90百分位数间距、标准差;

1、全距:最大值-最小值

2、平均偏差

3、半内四分位数间距

4、10-90百分位数间距

5、标准差

6、方差:标准差的平方

离差度量间的关系

第五章 矩、偏度和峰度

1、矩

2、r阶中心矩

3、偏度:分布不对称程度或偏离对称程度的反映

4、峰度:分布的陡峭程度,尖峰、扁峰、常峰态

第六章 初等概率论

1、概率

2、条件概率,独立和不独立事件

3、互不相容事件:两个或多个事件中,任意两个事件都不能同时发生

4、概率分布

离散型:离散型概率分布

连续型:概率密度函数、连续型概率分布

5、数学期望

如果一个人活得S美元的概率为p,则他的数学期望=pS

电子书资源:

大数据的统计学基础  https://pan.baidu.com/s/1AwT9gav5pK0xcjhgc6YchQ

统计学基本概念、统计学(第三版) https://pan.baidu.com/s/1BRhZgcGuDMelSuFWx4eLLA

上一篇 下一篇

猜你喜欢

热点阅读