正态分布
2020-05-13 本文已影响0人
limbo1996
参考书: 《白话统计学》
正态分布(normal distribution)
也叫钟形曲线
正态分布的性质
正态分布正态分布的基本特征:
- 对称
- 单峰
- 渐进,即左右尾不会触及x轴
对于描述统计,比如100名学生每天消耗的平均卡路里,最常吃的视频等等,描述统计一般只用来描述一个具体的样本。
但是,当想研究的不再是描述一个样本,而是某周岁即出现的准确概率,比如学生每日平均消耗2000卡路里的概率是多少,正态分布就有助于正确使用概率统计量。
此外,如果想从样本推断总体,推断统计,用于决定样本中观测到的一些现象是否代表了总体的一种实际现象,比如比较男女每日平均消耗的卡路里之间是否有差异,就可以用到正态分布。
正态分布详解
正态分布是理论分布, 很少有得自样本的取值严格服从正态分布。
违背正态分布假设的最明显结果就是与正态分布有关的概率不再有效
抽样方法与正态分布之间的关系
正态分布和抽样方法的关系:
正太分布的概率取决于:
- 分布的状态
- 认为样本与总体之间不存在某种形式的系统性差异
也就是抽样方法是无偏的,从同一总体中随机选取的相同容量的样本之间任何差异都是随机的,而不是系统的
偏度与峰度
峰度和偏度是用来描述分布的特征,如果一个样本取值不服从正态分布,
那么他可能服从不同形态的分布。如果少数取值在较大的一端,拖出一个长尾, 叫做正偏,反之叫做负偏
偏度不影响中位数,所以正偏的均值大于中位数,负偏均值小于中位数,正态分布,二者相等。
峰度指的是一个分布的平坦程度的形态,如果一个分布定点高于正态分布的顶尖,叫做尖峰分布,反之叫做扁峰分布。
对于正态分布,有大约68%的取值落入均值加减1个标准差的区间内,尖峰分布在均值周围的比例更大,扁峰分布更少