3 显著性检验

2022-01-18 本文已影响0人老姚记事本

3.1 p值和z值

一般性假设检验构建拒绝域 $R_\alpha$ 使得
$Pr_ 0 \{ x \in R_\alpha \} = \alpha$
对应的p值为：

(

R_\alpha

是根据显著性水平

\alpha

构建的，而显著的

p(x)

则根据包含x的最小区域计算的)

显然 $p(x)$ 越小越确定存在显著差异，p值引入了更多信息。

Fisher’s scale of evidence for interpreting p-values
在H0下，p值服从均匀分布

H_0:P = p(x) \sim U(0, 1)

接下来将主要使用Z值而不是P值

z(x) = \Phi^{-1}(p(x))

H_0:z(x) \sim \mathcal N(0, 1 )

z 值使我们能够将正态理论的力量用于解决大规模推理问题。

DTI数据例子

3.2 修正的p值和FWER

$FWER = Pr \{ Reject\ any\ true\ H_ { 0 i } \}$
控制流程目标 $FWER \leq \alpha$ ，经典做法是Bonferroni边界 $p_i \leq \alpha / N$
如果我们认为这是一种p值修正，则
$\widetilde{p}_i = \{ min( Np_i, 1 ) \}$
我们通过 $\widetilde{p}_i$ 来判断是否显著。
如果 $x$ 是测试数据， $FWER_\alpha(x)$ 是 $\alpha$ 为目标的控制流程，则
$\widetilde{p}_i(x)= inf_\alpha \{ H_{0i} \ rejected \ by\ FWER_\alpha(x) \ \}$
Holm控制过程为将p值排序后 $p_{(j)} \leq \frac{\alpha}{N - j + 1}$
对应修正后的p值为 $\widetilde{p}_i = \max_{ j \leq i }\{min((N - j + 1)p_{(j)}, 1) \}$

从修正后的p值可以明显看出，Holm过程优于Bonferroni过程。

3.3 逐步算法

介绍几种控制FWER的逐步算法。
step-down过程会现将p值排序 $p_{(1)} \leq p_{(2)}...\leq p_{(N)}$ 。因此如果 $p_{i}$ 被拒绝，则前面的p值也都会被拒绝。Holm方法是最早的例子之一。
通过closure principle可以将Bonferroni’s bound扩展为Holm’s procedure
如果假设p值间独立，可以得到Simes’ inequality，当全为H0时：
$Pr \{ p_{(i)} \geq \frac{\alpha i }{N}\ for\ i = 1 ,2,..., N \} \geq 1 - \alpha$
基于Simes’ inequality，Hochberg优化Holm’s adjusted p-values为
$\widetilde{p}_i = min( min_{j \geq i} \{ (N - i + 1 ) p_{(j)} \}, 1)$
此方案要基于独立前提，它是step-up过程

3.4 排列算法

Bonferroni bound的好处是不用关心p值得相关性，但是如果我们已知了相关性，这就变成了劣势。Westfall和Young将相关性考虑后对Holm的过程进行了优化。
如果将p值排序 $p_{(1)} \leq p_{(2)} \leq...\leq p_{(N)}$ ，用 $r_1, r_2,...,r_N$ 代表原始的下标： $p_{(j)} = p_{r_j}$
定义 $R_j = \{ r_j, r_{j+1} ,..., r_N \}$ （比 $p_{j}$ 大的p值的原始下标集合），且
$\pi(j) = Pr_0 \{ \min_{ k \in R_j}(P_k) \leq p_{(j)} \}$
此处 $(P_1, P_2, ...,P_N)$ 表示在H0（complete null hypothesis）下观测到 $(p_1, p_2, ...,p_N)$ 的概率
Westfall–Young step-down min-p定义为
$\widetilde{p}_i = \max_{j \leq i} \{ \pi(j) \}$
根据Boole’s inequality
$\pi_{(j)} \leq \sum_ {k \in R_j} Pr_0 \{ P_k \leq p_{(j)} \} = (N-j+1) p_{(j)}$
说明效果好于Holm法。
由于p值计算相对麻烦，也可以用t值替换
$\pi(j) = Pr_0 \{ \max_{ k \in R_j} (T_k) \geq t_{(j)} \} （3.38）$

现在问题的关键是，如何计算 $(P_1, P_2, ...,P_N)$ ？
带回第2章的例子， $X$ 是一个6033 * 102的矩阵， $X^*$ 是对它重排列后的矩阵。
定义 $J^* = (j_1^*, j_2^*, ...,j_n^*)$ ，是一个将参加实验人员随机排列后的顺序，对应的
$x_{ij}^* = x_{iJ^*(j)}\ \ for\ \ j=1,2,...,n\ \ and \ \ i=1,2,...,N$
仍然取前50个与后52个进行计算，得到
$T^* = (T_1^*,T_2^*,...,T_N^*)$
重复上述过程B（较大的数）轮，可以得到（3.38）的估计值
$\hat{\pi}(j) = \#\{ \max_{ k \in R_j} (T_k^*) \geq t_{(j)} \}/B$
这种评估比较科学的原因：

随机排列X使计算的T来及相同的混合分布
由于每次按病人随机排列，保留了基因之间的相关性

3.5 其它控制标准

FWER是传统多重检验控制规则，但是还有其它，比如：
per comparison error rate: PCER = E{ 错误拒绝数 } / N
excepcted error rate: EER = E{错误决策数(包含两类错误)} / N

Lehmann and Romano’s k-FWER criteria是FWER的变种，目标是控制错误拒绝零假设数不超过k，当k等于1时等于传统FWER。