不头秃的生物统计学2 - 单因素方差分析

2019-11-16 本文已影响0人发哥的档案室

biostatistic/blogger

方差分析我理解了很久，最让我困惑的是，为什么不是统一的？
为什么两个样本均值差异比较用 t 检验？
而三个或以上样本均值差异却用 F 检验。
尤其仔细想想，这两种检验方法计算过程好像大相径庭。

后来我才好像慢慢理解，为什么老师说两者其实是一回事。

F 分布

我们先来认识一下，什么是 F 分布

F 分布也称为：_{两个样本方差比的抽样分布}
翻开概率和统计的书，里面写到：

从一个正态总体 (μ,σ^2) 中随机抽取两个样本，其样本方差(S1)^2 与 (S2)^2 的比值为 F

F 分布曲线随之df1 和 df2 的变化而变化，由于F值是一尾的，一般『大方差样本作分子，小方差样本作分母，使得F值大于1』，df1 代表大方差自由度，df2 代表小方差自由度。

可见，F 检验原本应该是用来『比较两个样本方差的差异』。
如果说 F = 1，说明两个样本方差没有差异，如果 F > 1 且 F 越大，说明两个样本的方差越大。
和前面说的一样，由于抽样是随机的，所以得到的样本也是随机(第一次抽和第二次抽的样本不一样)，因此不同的抽样得到的样本方差，也是不一样的。这些所有可能的样本方差的集合，就构成了一个新的分布 (虽然每次抽样得到的样本方差不尽相同，但会有一定合理的范围，也就是说，无论怎么抽，样本方差的值还是有很大概率会落在某个区间)。
如果两个样本来自同一个整体，如果两个样本数量足够大，那个这两个样本方差的比值，也就是 F 值，应该很接近 1。
小样本时，根据两个自由度查表，得到相应的概率下的 F 理论值，和计算出来的 F 值比较，也能判断两个样本方差差异是否显著。如果是，说明这两个样本很可能不是来自同一个总体。

好的，知道这个后，和我要『比较多个样本均值差异』有什么关系呢？
我们先来想想，三个以上的东西进行比较时，应该要怎么比？

三个以上东西如何比较 (和后面多重比较名字区分开）

第一种思路是多重比较，即每两个东西都比一遍，比如 a,b,c 三个数，a > b, a > c，那 a 就是最大的。
第二种思路是类似跑步，同一起跑线上，单位之间内，看谁跑的距离多，谁就跑得快。

方差分析有点类似第二种思想 (以下是我的理解，如果不正确请指出)

首先想一个问题：
我们观测到的变异，是因为什么造成的？

假设一开始，我们找到了12头完全一样的猪。这时就像一张白纸，给什么处理，效果立竿见影。(同一起跑线)
在进行了不同的处理后，我们发现这些数据 (观测值) 发生了一定的变异。(跑了不一样的距离(体重))
我们现在想知道，这个变异到底是因为『施加了不同的处理』造成的，还有由于『其他(没有控制好)的因素造成的。(到底是因为猪群里面存在这健美猪？还是因为吃了不同的大力草饲料，才使猪跑的距离(体重)不一样，因为按理说，如果猪一样，给的处理也一样，那么同一个处理里面，所有猪的体重应该使一样才对)
也就是说，『不同处理』对『总体观测值的变异』有多大的贡献？如果『不同处理』贡献大，说明不同处理后对 (猪的体重变化) 影响大，即，不同(处理后的)样本均值存在着差异，这里就已经完成了多个样本的均值比较。
有差异不代表差异显著，所以我们要进行 F检验

方差分析的基本思想就是，将『观测值出现的变异』，归为『处理效应』和『随机(试验)误差』作用下产生的变异

##### 变异来源

我们想来考虑一下，什么因素会引起数据的波动 (变异) ？

1. 随机误差 (可减少但躲不过)：无法控制的偶然因素
2. 系统误差 (可改善甚至消除)：试验条件或人为错误
3. 处理效应 (按理说力度最大)


一个样本时：
- 只有随机误差和系统误差
- 随机误差：如抽样(个体)差异
- 系统误差：如测量的准确度

两个样本时：
- 随机误差：如抽样(个体)差异
- 系统误差：如测量的准确度
- 处理效应：如 (处理前后抽样差异，不同的处理后抽样的差异)

多个样本时：
- 随机误差：如抽样(个体)差异
- 系统误差：如测量的准确度
- 处理效应：如不同的处理后的差异

在严格控制各个试验环节后，我们可以认为，现在引起数据变异的就剩下两个因素：『随机误差』和『处理效应』

我们沿着『不同处理效应引起的变异』对『总体变异』有多大的贡献的思路

首先，我们明确
1. 处理内的个体值差异，是由于『随机误差』引起的
2. 处理间平均值的差异，是由于『处理效应』引起的
3. 排除了系统误差，『观察值的变异』只能是『处理变异』和『随机变异』贡献的
4. 如果『处理变异』显著，那么说明处理间差异显著，即不同样本均值差异显著

第二，我们知道『方差』是描述数据变异程度的一个指标

现在，『观察值的变异』只能是『处理变异』和『随机变异』贡献的

我们要怎么比较『处理变异』和『随机变异』谁的贡献更大呢？
1. 第一种思路 (做减法)：『处理变异』减去『随机变异』(但是问题又来了，差值多少才能说显著呢？我们不知道_{两个均值方差差数}的分布)
2. 第二种思路 (做除法)：『处理变异』比『随机变异』。根据前面介绍的 F 分布，两个样本方差比为 F 值，所有的两个样本可能的方差比构成 F 分布。这时我们可以进行 F 检验。

F 检验 (套公式，但需要了解公式每个部分的含义)

下面我们直接上例题演示一遍每个步骤的计算：
先理解每个公式符号的含义，直接套用公式
至于公式是怎么推导的，如果以后有空，再和大家分享。

按部就班套代入公式计算就好了，最后整理成下面这个表的样子。(填空)
(在这里问大家一个问题？如果每个处理的重复数 n 不一样呢？要怎么办？)

然后再来解释一下这张表。
先说结论：(在犯错为 0.05 的概率下)，不同饲料对猪的增重变化有显著性差异。 (做了这么多计算，也就仅仅能得出这样的结论，很伤心)

实际上，我们在用的时候，基本不用计算任何值，因为只有我们把数据输进去，把数据组织好，统计软件就会把所有相应的值算好，我们直接拿来用就好了。(关于结合统计软件，或者相关代码的应用。我以后有空再写。)

好了，现在我们知道，如果用『 F 检验』来检验『多个样本均值』是否存在显著性差异。但是也仅仅是知道，均值之间有差异而言。至于哪两个之间有显著差异，还是两两之间都有显著性差异，还是别的？我们都不知道。我们现在能知道的，仅仅是『样本均值』之间存在显著性差异。

在我们进一步做多重比较时，我们先来看看 F 检验与t检验的关系

F 检验与t检验关系

我一开始觉得非常奇怪，
为什么 F 检验算完 F 值比较完，得出差异显著以后，还要做 LSD (多重比较)，而不是像 t检验那样一步到位？

后来我好像明白，无论时 F 检验，还是 t 检验。
做的事情都是比较两个东西之间是否有差异
F 检验比较的是，两个样本方差
t 检验比较的是，两个样本均值

不同的是，

F 检验在方差分析中得出的结论是：『处理间方差』和『处理内方差』有显著性差异。说明『处理效应』的作用不能忽略，进而得到『不同(处理)样本间』有显著性差异。但是谁和谁之间是否有显著性差异？不知道。

t 检验得出的结论直接就是：两个样本均值存在显著性差异。因为对象很目前，只有两个，而且有差异，所以不需要进行多重比较。

实际上， t 检验和 F 检验做的是同样的东西，
只不过 F 检验涉及到多个样本，需要做平均/加权。
至于为什么要平方？因为不平方的话，差值都正负抵消，St = 0

如果不相信的话，可以看一下当 k = 2 时，也就是两个样本均值比较时
F 值 的计算结果就是 t 值 的平方

好了，F 检验解决了多个样本之间是否存在显著性差异的问题
但是还没有解决『究竟是哪些样本之间存在显著性差异？』

多重比较

不知道看这里的时候，大家是不是何为一样懵逼
因为课件上分明写着，多重比较的 LSD 法本质也是一种 t 检验
？？？
所以前面吐槽了一大堆各种 t 检验不好，有问题
最后又回到 t 检验
？？？
好吧，其实好像还真的不一样。

首先，什么是多重比较？

统计学上多个平均数两两相互比较称为『多重比较』
比如：A,B,C。A和B比，B和C比，B再和C比。

第二，老师上课讲的『多重比较有 LSD』和 (SSR 和 q)三种方法

这里主要讲 LSD
剩下两个讲一下方法和公式，不多解释
这些东西在统计软件上都是一键完成的事情，我们现在希望弄明白的是原理，以及出来的表要怎么看

LSD 法进行多重比较

LSD 结果的表示方法：字母法 / 梯形法 (我个人更喜欢梯形法，直观明了)

字母法：

梯形法：

最后提一下，除了LSD法外，LSR 法里面的 SSR 和 q-test

准确性来讲：q-test > SSR > LSD
但是有没有必要用 q-test？如果LSD 就能做出来，没必要用q-test
不过在用统计软件时，全部选上啊，管它呢，又不是你算
最后出来结果看一下，哪个合适用哪个。

最后，我们完整地写一遍『单因素方差分析』的步骤 (考试的孩子看这里)

其实也蛮轻松的嘛 [NosePick]

好难过，讲了这么久才讲完_{单因素方差分析}。
_{双因素方差分析}以后有空再讲吧 (好累，也应该不考)

最后提一点别的东西。

F 检验与方差同质性检验

不知道大家看到这一页PPT的时候是不是有点懵
这是两个小样本成组 t 检验的一页ppt
好好的 t 检验
怎么就突然出现F 检验了呢？这个跟后面的方差分析有什么关系吗？

额，应该是没什么关系的

我们再来回顾一下，F 检验时用来干嘛的
F 检验是用来『比较两个样本方差的差异』

从一个正态总体 (μ,σ^2) 中随机抽取两个样本，其样本方差(S1)^2 与 (S2)^2 的比值为 F

只不过在方差分析中，我们正好利用了 F 检验，将『组间变异』放在分子，『组内变异』放在分母

那为什么上面的 t 检验会扯到 F检验呢？
实际上，对样本平均数的假设检验是以方差同质性为前提的。
方差同质性检验，就是要从各样本的方差来推断其总体方差是否相同。
不过一般来说，只要满足完全随机抽样，方差同质性就会满足，即 σ1 = σ2

一个样本方差同质性检验：卡法检验法
两个样本方差同质性检验：F检验法
三个或以上样本方差同质性检验：卡法检验法 + 连续矫正
至于为什么？等我理解了，并且有空再说吧

最后还是那句话
本人能力有限
若有谬误，劳烦指出，我会尽快更正
我发现我老是打错别字，大家适应一下吧

作者：发哥
链接：发哥的档案室 - 简书
來源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

不头秃的生物统计学2 - 单因素方差分析

biostatistic/blogger