生信软件札记统计R语言学习

差异分析的检验方法

2021-03-31  本文已影响0人  蓬举举

前言

众所周知,当你所自己今年比去年更优秀的时候是不可以随便吹牛的,请把你在简书上发文的频率以及质量摆出来!

面对今年和去年的数据,或许你需要一个统计检验的方法...

组间差异检验,终于有人讲清楚了!

总结

方差齐性 

也就是方差相等,在t检验和方差分析中,都需要满足这一前提条件。在两组和多组比较中,方差齐性的意思很容易理解,无非就是比较各组的方差大小,看看各组的方差是不是差不多大小,如果差别太大,就认为是方差不齐,或方差不等。如果差别不大,就认为方差齐性或方差相等。当然,这种所谓的差别大或小,需要统计学的检验,所以就有了方差齐性检验。

正态分布检验

在t检验和方差分析中,要求样本是来自正态分布的样本。以此为前提才可以对样本的均值进行统计检验。检验的目的是判断这两个样本是否来自于同一个总体的随机抽样结果还是来自完全不同的样本。另外需要注意的是,如果样本量大于30,此时样本的均值也近似服从正态分布,这是我们也可以使用t检验。

百度百科

参数检验和非参数检验

组间差异检验,终于有人讲清楚了!

参数检验和非参数检验的区别:

1 参数检验是针对参数做的假设,非参数检验是针对总体分布情况做的假设,这个是区分参数检验和非参数检验的一个重要特征。例如两样本比较的t 检验是判断两样本分别代表的总体的均值是否具有差异,属于参数检验。而两样本比较的秩和检验(wilcoxcon 检验及Mann-Whitney 检验)是判断两样本分别代表的总体的位置有无差别(即两总体的变量值有无倾向性的未知偏离),自然属于非参数检验。

2 二者的根本区别在于参数检验要利用到总体的信息(总体分布、总体的一些参数特征如方差),以总体分布和样本信息对总体参数作出推断;非参数检验不需要利用总体的信息(总体分布、总体的一些参数特征如方差),以样本信息对总体分布作出推断。

3,参数检验只能用于等距数据和比例数据,非参数检验主要用于记数数据。也可用于等距和比例数据,但精确性就会降低。

总结

如何理解非参数检验

参数检验通常是假设总体服从正态分布,样本统计量服从T分布的基础之上,对总体分布中一些未知的参数,例如总体均值、总体方差和总体标准差等进行统计推断。如果总体的分布情况未知,同时样本容量又小,无法运用中心极限定理实施参数检验,推断总体的集中趋势和离散程度的参数情况。这时,可以用非参数检验,非参数检验对总体分布不做假设,直接从样本的分析入手推断总体的分布。

与参数检验相比,非参数检验适用范围广,特别适用于小样本数据、总体分布未知或偏态、方差不齐及混合样本等各类型数据。

非参数检验类型

非参数检验应用广,但参数检验精确度更高。

SPSS赛高

采用SPSS进行各项检验

总结

方差和T检验的区别在于,对于T检验的X来讲,其只能为2个类别比如男和女。如果X为3个类别比如本科以下,本科,本科以上;此时只能使用方差分析。

方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。

卡方检验与Fisher精确检验区别

均为无序分类变量

① 卡方检验

卡方检验常用于分析无序分类变量之间的相关性,也可以用于分析二分类变量之间的关系。但是该检验只能分析相关的统计学意义,不能反映关联强度。因此,我们常联合Cramer's V检验提示关联强度。

② Fisher精确检验

Fisher精确检验可以用于检验任何R*C数据之间的相关关系,但最常用于分析2*2数据,即两个二分类变量之间的相关性。与卡方检验只能拟合近似分布不同的是,Fisher精确检验可以分析精确分布,更适合分析小样本数据。但是该检验与卡方检验一样,只能分析相关的统计学意义,不能反映关联强度。

正态分布的一些定理

(1)从总体中随机抽取容量为n的一切可能个样本的平均数之平均数,等于总体的平均数。

(2)从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。

(3)虽然总体不是正态分布,如果样本容量较大,反映总体μ和σ的样本平均数的抽样分布,也接近于正态分布。

原始数据比较符合正态分布,那么推荐使用T检验,如果偏离较大,那么推荐使用非参数检验,如果样本量较大,那么两种检验方法都是可以的。

总体方差已知以及总体方差未知的情况
上一篇下一篇

猜你喜欢

热点阅读