2023-01-12从误差变异系数说起,关于标准差和标准误等
误差变异系数
是从品种区域比较试验里看到的词
式中 Mse 为方差分析以中小区为单位的误差项均方,Y 为试验均值。CEV 越小,则试验精确度越高。马育华、莫惠栋认为田间试验误差变异系数 (CEV) 小于12%,则试验误差
控制较好。在区域试验中,普遍认可的试验误差变异系数要求小于15%,即试验误差变异系数若大于15%,则表明该试验点的试验质量较差,其试验数据不予汇总统计。
来自《浙江省鲜食玉米品种区域试验的试验精确度与精度》
首先来说说,总体和样本
2个有啥区别啊?举例子:我们做实验进行n个处理的所有样品,这就包括了目前你做的试验、以前曾经谁做的以及将来可能做的所有处理的集合,这在统计学中称为“总体”(我们做实验的处理永远只是总体的一部分,所以总体永远未知)。
在频率主义统计学的思想中,对于总体这么一个抽象性的概念,会有一个真值,它代表了这些个处理的总体趋势,但我们永远不知道它到底是多少。而我们做的一个个试验,都是这个总体中吐出的一个个“样本”,样本量越多,越接近(总体)真实值。
自然,每一个样本与那个未知真值的差,便是这个样本的随机误差。由于尺子本身不准、测量方法不正确(比如总是往一边歪着脑袋读数之类)等原因所导致的(这些原因导致的误差被称为“系统误差”),更不是由于人为疏忽而产生的。它是纯粹由于随机因素而产生的、无法消除的测量值与真值的偏差,因此被称为“随机误差”。
再来说说,标准差和标准误
两者的区别可以用一个例子来引入一下:
假设某一学校有1000名学生(将其作为一个总体),欲了解全校学生身高,随机抽取了100人,这100人的身高的波动范围就是标准差。这个标准差反映了在一次抽样中原始数据的波动情况。如果我们做了多次抽样,比如我抽了10次,每次仍然是100人,这样就有10个样本,每个样本中都是100人(注意:一次抽样叫做一个样本,你在一次抽样中抽取了100人,不能说你有100个样本,而是你有一个样本,样本中是100个人)。
对于抽取的10个样本,每个样本都可以计算一个均值,这样10个样本就可以计算出10个均值。将这10个均值作为原始数据,仍然可以计算出均值和标准差,这里的标准差就是标准误,它是用10个均值计算的,而标准差是用一次样本中的原始数据计算的。
标准差:是离均差平方的算术平均数(即:方差)的算术平方根,用σ表示。样本原始数据的标准差。
标准差反映了一个样本中原始数据的波动情况,标准差越大,表明原始数据之间差别越大。
任意一个正态分布(高斯分布)可以由两个参数确定,一个是它的均值(也叫位置参数)µ,决定它在数轴上的什么方位;一个是其标准差(也叫形状参数)σ,决定它的胖瘦。因此,我们把正态分布记为N( µ, σ)。
N(0,1),也就是平均值为0,标准差为1的正态分布,称为“标准正态分布“
标准误:样本统计量的标准差。
如果样本之间波动小,可以理解为抽取的样本的代表性可能比较好,因为每次抽取计算的均值都差不多。所以可以用标准误来反映抽样误差的大小,如果标准误比较大,提示可能抽样误差较大,也就是说样本的代表性可能不好,抽取的样本有偏。
标准差和标准误明明是2个东西,公式上为什么是:标准差σ/例数n的平方根=标准误呢?
还有一个很实际的问题,可能有的人会说,实际中怎么可能多次抽样呢?不错,实际中的确很难做到多次抽样,我们通常只能抽取一次。但是我们仍然可以根据抽取一次的样本的原始数据计算(或者叫估算更为准确)标准误。这也就是统计书中给出的标准误的计算公式(所以从计算公式不能看出它的直观含义,如果你直接从公式出发理解标准误的含义还有可能会误导你),即标准差/例数的平方根。已经有统计学家都论证研究过了,用这个公式是可以代表样本之间的波动情况的。
标准差 | 标准误 | |
---|---|---|
一个样本里的个体之间区别有多大。 | 从一个population 里取多个样本,样本之间的区别有多大。 | |
计算对象 | 根据一次抽样的原始数据计算的 | 根据多次抽样的样本统计量(可以是均值,也可以是率等)计算的 |
只是一个描述性指标,只是描述原始数据的波动情况 | 是跟统计推断有关的指标,大多数的统计量计算都需要用到标准误。 |
统计量计算怎么用到标准误呢?举个例子:
很多统计量都跟标准误有关,以简单的t检验为例,可能以前有的人都没有注意过。仔细观察一下就可以发现,t检验统计量的分子是两组样本数据的均值差值,反映了样本数据的差异;分母是标准误,反映了抽样误差。所以t检验反映了什么呢?其实就是看到底是抽样误差大还是真实差异大。如果分母的抽样误差大,那就说明结果可能不可靠,所以P值就会比较大;如果分子的差异大,说明抽样误差造成这种差异的可能性不大,所以P值就会比较小。
图片.png
参考资料:
https://www.zhihu.com/question/22864111?utm_source=zhihu&utm_medium=social&utm_oi=27819925045248
https://www.cmtopdr.com/post/detail/8fd51501-8189-4e77-8bb9-cd4b031dd10a
https://keydifferences.com/difference-between-standard-deviation-and-standard-error.html