statistical

《商务与经济统计》笔记(三)

2019-05-28  本文已影响5人  马路仔

描述统计学2:数值方法

关键术语

样本统计量:用老对样本进行综合度量的数值(如样本平均数\bar{x} ,样本方差 s^2 和样本标准差 s )。

总体参数:用来对总体进行综合度量的数值(如总体平均数\mu ,总体方差 \sigma ^2 和总体标准差 \sigma )。

点估计:用来估计相应总体参数的样本统计量,如\bar{x} s^2 和 s。

平均数:数据中心位置的一种度量,计算方法是将所有数据值加总,再除以数据的个数。

加权平均数:通过给每一个观测值分配一个反映其重要性的权重,而得到的平均数。

中位数:数据中心位置的一种度量,它是当数据按照升序排列时,处于数据中间位置的数据值。

几何平均数:数据中心位置的一种度量,计算方法是n个数值乘积的n次方根。

众数:数据位置的一种度量,被定义为是出现次数最多的数值。

百分位数:一个数值,在数据集中至少有p%的观测值小于或等于该值,且至少有(100 - p)% 的观测值大于或等于该值。第50百分位数就是中位数。

四分位数:第25百分位数,50百分位数和75百分位数分别是第一四分位数、第二四分位数(中位数)和第三四分位数、四分位数将根据集分为四个部分,每个部分大约包含25%的数据。

极差:数据变异程度的一种度量,它的定义是最大值与最小值之差。

四分位数间距:数据变异程度的一种度量,它的定义是第三四分位数与第一四分位数之差。

方差:数据变异程度的一种度量,计算的依据是数据值与平均数的平方离差。

标准差:数据变异程度的一种度量,是方差的正平方根。

标准差系数:数据变异程度的一种度量,是标准差除以平均数再乘以100。

偏度:数据变异程度的一种度量,数据偏的偏度为负值;数据分布对称的偏度为0;数据右偏的偏度为正值。

z-分数x_{i} 与平均数的离差(x_{i} -\bar{x} )除以标准差s得到的数值。z-分数也称为标准化数值,表示以标准差的个数度量的x_{i} 与平均数的距离。

样本统计量和总体参数的表示符号

重要公式:

样本平均数

\bar{x} =\frac{\sum\nolimits{x_{i} } }{n}

总体平均数

\mu =\frac{\sum\nolimits{x_{i} } }{n}

加权平均数

\bar{x} = \frac{\sum\nolimits{w_{i} x_{i} }}{\sum\nolimits{w_{i} } }

几何平均数 总体方差 样本方差 标准差 标准差系数 z-分数
上一篇下一篇

猜你喜欢

热点阅读