《商务与经济统计》笔记(三)
2019-05-28 本文已影响5人
马路仔
描述统计学2:数值方法
关键术语
样本统计量:用老对样本进行综合度量的数值(如样本平均数,样本方差 和样本标准差 s )。
总体参数:用来对总体进行综合度量的数值(如总体平均数,总体方差 和总体标准差 )。
点估计:用来估计相应总体参数的样本统计量,如, 和 s。
平均数:数据中心位置的一种度量,计算方法是将所有数据值加总,再除以数据的个数。
加权平均数:通过给每一个观测值分配一个反映其重要性的权重,而得到的平均数。
中位数:数据中心位置的一种度量,它是当数据按照升序排列时,处于数据中间位置的数据值。
几何平均数:数据中心位置的一种度量,计算方法是n个数值乘积的n次方根。
众数:数据位置的一种度量,被定义为是出现次数最多的数值。
百分位数:一个数值,在数据集中至少有p%的观测值小于或等于该值,且至少有(100 - p)% 的观测值大于或等于该值。第50百分位数就是中位数。
四分位数:第25百分位数,50百分位数和75百分位数分别是第一四分位数、第二四分位数(中位数)和第三四分位数、四分位数将根据集分为四个部分,每个部分大约包含25%的数据。
极差:数据变异程度的一种度量,它的定义是最大值与最小值之差。
四分位数间距:数据变异程度的一种度量,它的定义是第三四分位数与第一四分位数之差。
方差:数据变异程度的一种度量,计算的依据是数据值与平均数的平方离差。
标准差:数据变异程度的一种度量,是方差的正平方根。
标准差系数:数据变异程度的一种度量,是标准差除以平均数再乘以100。
偏度:数据变异程度的一种度量,数据偏的偏度为负值;数据分布对称的偏度为0;数据右偏的偏度为正值。
z-分数:与平均数的离差()除以标准差s得到的数值。z-分数也称为标准化数值,表示以标准差的个数度量的与平均数的距离。
样本统计量和总体参数的表示符号重要公式:
样本平均数
总体平均数
几何平均数 总体方差 样本方差 标准差 标准差系数 z-分数加权平均数