商务与经济统计第三章笔记
描述统计学2:数值方法
1、位置的度量
1)平均数
还有加权平均数和几何平均数
2)中位数
出现异常值的情况下,中位数提供了比平均数更好的中心位置度量。
3)众数
4)百分位数
L=p/100*(n+1)
5)四分位数
Q1=第一四分位数
Q2=第二四分位数(也是中位数)
Q3=第三四分位数
2、变异程度的度量
1)极差
2)四分位间距IQR
四分位间距是中间50%的数据的极差
IQR=Q3-Q1
3)方差
方差依赖于每个观测值与平均值之间的差异。
方差的单位是平方项。
总体方差
商务与经济统计第三章笔记样本方差
商务与经济统计第三章笔记4)标准差
标准差单位度量与原始数据的单位度量相同。
商务与经济统计第三章笔记5)标准差系数
标准差/平均数*100%
也称变异系数,用于不同样本间平均值相差较大时
6)平均绝对偏差MAE
能够更好地反应预测值误差的实际情况
商务与经济统计第三章笔记3、相对位置的度量
1)z-分数,又称标准化数值
帮助我们确定数值距离平均数有多远
商务与经济统计第三章笔记2)切比雪夫定理
指出与平均数的距离在某个特定个数标准差之内的数据值所占的比例
商务与经济统计第三章笔记3)经验法则
商务与经济统计第三章笔记4、分布形态
分布形态的一种重要的数值度量叫偏度
分别有正偏态分布和负偏态分布
正偏态分布,又叫右偏,偏度是正直
平均数>中位数>众数
负偏态分布,又叫左偏,偏度是负值
平均数<中位数<众数
5、异常值的检测
1)标准化数值(z-分数)
根据经验法则,对于钟形分布的数据,几乎所有数据值与平均值的距离在3个标准差之内。
2)第一四分位数、第三四分位数和四分位数间距
下限=Q1-1.5IQR
上限=Q3+1.5IQR
6、汇总统计量
1)五数概括法
最小值、第一四分位数(Q1)、中位数(Q2)、第三四分位数(Q3)、最大值
2)箱形图
基于五数概括法的数据图形汇总
商务与经济统计第三章笔记 商务与经济统计第三章笔记7、两变量间关系的度量
1)协方差
协方差求两变量间是否存在线性相关关系,缺点是受单位影响较大,因此得出的相关强度也不同,于是产生了相关系数。
样本协方差
商务与经济统计第三章笔记总体协方差
商务与经济统计第三章笔记2)相关系数
相关系数等于样本协方差除以x的标准差与y的标准差的乘积。
样本相关系数
商务与经济统计第三章笔记总体相关系数
商务与经济统计第三章笔记注意:相关系数提供了线性关系但不是因果关系的度量。