统计分析方法总结
2019-04-28 本文已影响57人
桃桃沙弥
参数检验
先决条件:已知总体服从正态分布(先决条件),通常总体方差也未知,推断总体均值
统计方法 | 说明 | 类型 | 统计量 | 前提 |
---|---|---|---|---|
单样本t检验 | 推断总体均值与指定检验值之间差异是否显著 | 对总体均值的假设检验 | t统计量 | 总体分布服从正态分布,或者样本量n较大,由中心极限定理得样本均值近似服从正态分布 |
两独立样本t检验 | 利用来自两总体的独立样本,推断两总体均值是否存在显著差异 | 总体均值检验 | t统计量 | 总体分布服从正态分布,或者样本量n较大,由中心极限定理得样本均值近似服从正态分布 |
配对样本t检验 | 相对于两独立样本t检验,样本是相互关联的,样本量相同 | 总体均值检验 | t统计量 | 总体分布服从正态分布,或者样本量n较大,由中心极限定理得样本均值近似服从正态分布 |
非参数检验
统计方法 | 说明 | 类型 | 思想 | 统计量 | 服从分布(小样本) | 服从分布(大样本) | 适用对象 |
---|---|---|---|---|---|---|---|
卡方检验(总体分布) | 判断总体分布与期望分布是否存在显著差异 | 总体分布检验 | 基于划分子集的观测频数近似服从卡方分布 | 卡方统计量(典型:pearson卡方) | ? | k-1自由度卡方分布 | 分类变量 |
二项分布检验 | 判断样本来自的总体是否服从指定概率值为p的二项分布 | 总体分布检验 | 小样本采用精确检验,大样本采用近似检验 | 小样本直接计算概率,大样本Z统计量(有连续性校正) | ? | ? | 二值分类变量 |
单样本KS检验 | 判断样本来自的总体是否服从某一理论分布 | 总体分布检验 | 基于拟合优度 | KS统计量D(观测值与经验累积分布的最大绝对差值)(有修正) | ? | 根号n×D服从KS分布 | 连续型变量 |
2独立样本曼-惠特尼U检验 | 推断2个样本来自的2个总体的分布是否存在显著差异 | 总体分布检验 | 基于两样本秩和 | 曼惠特尼U统计量 | 曼惠特尼分布 | 正态分布 | 没有特指 |
多独立样本KW检验 | 推断多个样本来自的多个总体的分布是否存在显著差异 | 总体分布检验 | 方差分析思想+秩 | KW统计量(秩组间平方和/秩总离差平方和的平均) | KW分布 | k-1自由度卡方分布 | 没有特指 |
2配对样本符号检验 | 推断样本来自的2个总体的分布是否存在显著差异 | 总体分布检验 | 正负号个数做二项分布检验(p是否为0.5) | 无 | 无 | 无 | 没有特指 |
2配对样本Wilcoxon检验 | 推断样本来自的2个总体的分布是否存在显著差异 | 总体分布检验 | 正负秩和统计量 | W统计量(min正负秩和统计量) | W统计量符合Wilcoxon符号秩分布 | W构造的Z统计量符合正态分布 | 没有特指 |
多配对样本Friedman检验 | 推断样本来自的多个总体的分布是否存在显著差异 | 总体分布检验 | 方差分析思想 | Friedman统计量 | ? | k-1自由度卡方分布 | 数值型变量 |
多配对样本Cochran Q检验 | 推断样本来自的多个总体的分布是否存在显著差异 | 总体分布检验 | 方差分析思想+检验各个区组取1的概率 | Cochran Q统计量 | ? | k-1自由度卡方分布 | 二值变量 |
多配对样本Kendall检验 | 在Friedman检验总体分布是否一致的基础上,检验判断者的判断标准是否一致(基于协同系数W衡量组间差异程度) | 总体分布检验 | 方差分析思想 | 协同系数W | k-1自由度卡方分布 | 数值型变量 |
注:1. 处理与区组:处理代表控制变量,控制变量有多少种取值,即有多少种处理水平。区组代表样本组别数量。在多配对样本中会出现这种概念。
- 方法分析思想:多因素/多样本常涉及。观测变量的总变差是由控制变量与随机变量产生的。将观测变量的离差平方和进行分解,分解为组间平方和与组内平方和,或者加上交互作用带来的离差。其中组间平方和,代表控制变量的不同水平带来的影响,组内平方和代表由于抽样误差带来的影响,最后一个是控制变量交互作用带来的影响。
- KW检验量与Friedman检验量:两者计算式相近。但前者是混合排序求秩,后者是在各个区组内排序,对每个处理水平进行求和或者求平均得到的。
方差分析
统计方法 | 说明 | 类型 | 统计量 | 服从分布 |
---|---|---|---|---|
单因素方差分析 | 研究单个因素(的不同水平)对观测变量的影响 | 对总体均值的假设检验 | F统计量 | (k-1,n-k)自由度的F分布 |
多因素方差分析 | 研究多个因素的不同水平对观测变量的影响 | 对总体均值的假设检验 | F统计量 | ? |
协方差分析 | 考虑协变量的影响,研究单/多个因素的不同水平对观测变量的影响 | 对总体均值的假设检验 | F统计量 | ? |