统计学学习笔记——day5
2022-04-08 本文已影响0人
monkey_study
成组多样本方差分析
数据多组样本,考虑方差分析
案例 评价某临床新药耐受性及安全性的2a期临床试验中,对符合纳入标准的30明健康志愿者随机分为3组,每组10人。各组注射剂量分别为0.5,1,2U,观察某指标(以凝血活酶时间为例)变化,问题:不同剂量引起的某指标变化有无不同?
通过样本均数估计总体均数有无差别?
分析:
- 本案例属于RCT
- 由两个变量组成,注射剂量以及某指标
- 分组比较的组数为多组(3组)
- 研究的结局变量是某指标
- 结局变量类型是定量变量
- 结局变量分布状态(正态or偏态?)
三组进行正态性检验,P值均>0.05,可认为正态分布(Shapiro-wilk法),用方差分析。
方差分析(F检验)/ANOVA
研究设计:随机分组
单因素分组:3个及以上水平
可以是低/中/高剂量组
药物A/B/安慰剂组
资料类型:定量数据
符合条件:正态、方差齐性、独立性
总结:多组独立、定量、正态、方差齐性数据
方差分析假设
以三组总体均数比较为例子
H0:μ1=μ2=μ3
H1(备择假设):总体均数不全相等
方差分析思想
- 方差分析的思想来自于误差分解,来自同一个分布的数据,抽样带来的误差仅有随机误差,即组内误差(SSE);但是在分析数据时,来组不同分组的数据所带来的误差称为组间误差(SSA)。由此,总体误差(SST)可以分为组内以及组间误差。
我们检验不同分组的数据均值是否相等,即检验组间误差是否过大。 - 多组数据比较(3组为例子)
- 可以做三个成对的t检验,研究三组之间总体均数,但是会破坏整体性比较的氛围(猜测原因是,多组比较会麻烦?),因此一般多组均数比较不用t检验
- 那么总体比较的目的是什么,他们之间一样或者不一样?
- 合适的方式是:直接观察整体差异。因此,不用均数,改用方差,观察变异程度。
- 方差是一个统计量,对其的分析,可用来识别多组数据是否一致。
方差分析与F值
数据的变异和方差最终计算产生F检验统计量,通过该值计算Pvalue。
方差分析步骤
1.** 提出假设检验,确定检验水准**
H0:μ1=μ2=μ3,即三个剂量组某指标的总体均数相同
H1:μ1,μ2,μ3不全相同,即三个剂量组某指标总体均数不全相同
检验水准:α=0.05
-
计算检验统计量F值
image.png
image.png
-
确定P值,做出推断结论
计算F值,得到相应P值,进行结果判定。
进行方差齐性检验,方差不齐用welch检验(校正F检验)。平均值相等性稳健检验
描述文字与表格
文字:三组不同剂量下的某指标总体均数存在统计学差异(F=多少,P=多少)。
表格内容:分组,均数±标准差,F检验(F值,Pvalue)
总结
-方差分析要求正态性与方差齐性,实际操作中,如果近似正态可以用方差分析,方差不齐用welch校正方差分析。
- 论文发表一般不写方差齐性以及正态性检验结果。
- 严重偏态或者存在不确定的数值,可以采用秩和检验分析
统计基础理论与差异分析图片展示:组间差异检验,终于有人讲清楚了! - 简书 (jianshu.com)
关于显著性检验,你想要的都在这儿了!!(基础篇) - Mario-Chao - 博客园 (cnblogs.com)
利用R语言heatmap.2函数进行聚类并画热图 | Public Library of Bioinformatics (plob.org)