2018-05-11统计学中的几个基本概念
1. 中位数
中位数是位于依一定大小顺序排列的一组数据中央位置的数值,大于或小于这一数值各有一半的数据分布。如:
例1:3 5 7 8 9 11 14
本组数据的个数为奇数,取中间数据8即为中位数
例2:17 15 14 12 11 10 9 6
本组数据的个数为偶数,取中间两位的平均数,(12+11)/2=11.5
2. 平均数与加权平均数
加权平均数是不同比重数据的平均数。
例1:某生英语单元测验,前四单元的成绩分别为75,83,70,77。则其这几次的平均成绩为:(75+83+70+77)/4=76.25
例2:某初中一年级英语测验,甲班32人,平均分数为72.6。乙班40人,平均分数为80.2。丙班36人,平均分数为75。则该校全年级本次测验总的平均分为?
3. 平均差
所谓平均差,也称离散度,就是每一个数据与该组数据的中位数(或算术平均数)离差的绝对值的算术平均数,通常用MD表示。平均差是一种平均离差。离差是总体各单位的标志值与算术平均数之差。因离差和为零,离差的平均数不能将离差和除以离差的个数求得,而必须讲离差取绝对数来消除正负号。 平均差是反应各标志值与算术平均数之间的平均差异。平均差越大,表明各标志值与算术平均数的差异程度越大,该算术平均数的代表性就越小;平均差越小,表明各标志值与算术平均数的差异程度越小,该算术平均数的代表性就越大。 其统计学计算公式如下:
4. 标准差
标准差(Standard Deviation) ,也称均方差(mean square error),是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同。简单来说,标准差是一组数据平均值分散程度的一种度量。一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。
例如,两组数的集合 {0, 5, 9, 14} 和 {5, 6, 8, 9} 其平均值都是 7 ,但第二个集合具有较小的标准差。
5. 方差
方差是各个数据与平均数之差的平方的平均数。在概率论和数理统计中,方差(英文Variance)用来度量随机变量和其数学期望(即均值)之间的偏离程度。通俗点讲,就是和中心偏离的程度!用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差。在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定。
6. 标准分
标准分是以标准差为单位 ,表示某一分数与平均数的差 ,反映了一个原始分数在团体中所处的位置。原始分数转换成标准分数后就成为一种抽象的数值 ,不受原始测量单位的影响。因此 ,原本不能直接比较的不同单位的量数变成标准分数后就可以进行比较了。 标准分的计算方法为:原始分数(测验分数)与平均分数相减,再除以标准差所得的商。 公式如下:
例:甲同学,某次测验,语文成绩为73, 数学成绩为79。该班语文平均分为48.3, 标准差为13.9。数学平均分为66.9,标准差为18.5。请计算他两门课程的标准分。
语文标准分=(73-48.3)/ 13.9=1.8
数学标准分=(79-66.9) / 18.5=0.7
说明:标准分的两个特点:一是所有 Z分数的平均数为0,即原始分与平均数相等时,Z分数为0; 二是标准差等于1,即原始分高于平均数1 个标准差时 ,Z分数为1。从该生的Z标准分看出,他的语文成绩明显好于数学成绩。
由于标准分数有正负之分 ,使用不方便 ,所以在实际运用时常用 T分数 ,换算公式为:
T=50+10Z
还以上题为例,该同学的语文标准分(T)=50+1.8×10=68,数学标准分(T)=50+0.7×10=57
标准分的应用:
比较各个学生成绩在班级中地位;
比较某个学生两科或多科测验中所得分的优劣,精确地计算学生的总成绩。
确定等级评定的人数。