生物信息学统计分析与数据挖掘

F检验与T检验

2019-12-06  本文已影响0人  小幸运Q

为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。

什么是统计学意义(P值或sig值)?

p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的


F检验:

F检验又叫方差齐性检验。在两样本t检验中要用到F检验。

从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验。

F=\frac{s_1^2/{\sigma_1}^2}{s_2^2/{\sigma_2}^2} \rightarrow F(n_1-1,n_2-1)

样本标准偏差的平方,即:S^2=\sum_{i=1}^{n}(x-\overline{x})^2/(n-1)
两组数据就能得到两个S2值:F=\frac{S^2}{S'^2}

然后计算的F值与查表得到的F_表值比较,如果:

(1)F < F_表 表明两组数据没有显著方差差异;
(2)F ≥ F_表 表明两组数据存在显著方差差异。

适用的F检验例子包括:

  1. 假设一系列服从正态分布的母体,都有相同的标准差。这是最典型的F检验,该检验在方差分析(ANOVA)中也非常重要。

  2. 假设一个回归模型很好地符合其数据集要求,检验多元线性回归模型中被解释变量与解释变量之间线性关系在总体上是否显著。

image.png

T检验(对两样本\overline{x}差异显著性进行检验,须知两样本的\sigma是否相等,T检验的计算会因方差不等而不同)

T=\frac{\overline{X}-u}{S/\sqrt{n}} \rightarrow t(n-1)

举个例子

比如,你要检验两独立样本均数差异是否能推论至总体,而行的t检验。

两样本(如某班男生和女生)某变量(如身高)的均数并不相同,但这差别是否能推论至总体,代表总体的情况也是存在著差异呢?

为此,我们进行t检定,算出一个t检定值。

若显著性sig值很少,比如<0.05(5%),亦即是说,「如果」总体「真的」没有差别,那么就只有在机会很少(5%)、很罕有的情况下,才会出现目前这样本的情况。虽然还是有5%机会出错(1-0.05=5%),但我们还是可以「比较有信心」的说:目前样本中这情况(男女生出现差异的情况)不是巧合,是具统计学意义的,「总体中男女生不存差异」的虚无假设应予拒绝,简言之,总体应该存在显著差异。

上一篇下一篇

猜你喜欢

热点阅读