3 显著性检验

2022-01-18  本文已影响0人  老姚记事本

3.1 p值和z值

一般性假设检验构建拒绝域R_\alpha使得
Pr_ 0 \{ x \in R_\alpha \} = \alpha
对应的p值为:


(R_\alpha是根据显著性水平\alpha构建的,而显著的p(x)则根据包含x的最小区域计算的)

显然p(x)越小越确定存在显著差异,p值引入了更多信息。

Fisher’s scale of evidence for interpreting p-values
在H0下,p值服从均匀分布
H_0:P = p(x) \sim U(0, 1)
接下来将主要使用Z值而不是P值z(x) = \Phi^{-1}(p(x))
H_0:z(x) \sim \mathcal N(0, 1 )
z 值使我们能够将正态理论的力量用于解决大规模推理问题。
DTI数据例子

3.2 修正的p值和FWER

FWER = Pr \{ Reject\ any\ true\ H_ { 0 i } \}
控制流程目标FWER \leq \alpha,经典做法是Bonferroni边界p_i \leq \alpha / N
如果我们认为这是一种p值修正,则
\widetilde{p}_i = \{ min( Np_i, 1 ) \}
我们通过\widetilde{p}_i来判断是否显著。
如果x是测试数据,FWER_\alpha(x)\alpha为目标的控制流程,则
\widetilde{p}_i(x)= inf_\alpha \{ H_{0i} \ rejected \ by\ FWER_\alpha(x) \ \}
Holm控制过程为将p值排序后p_{(j)} \leq \frac{\alpha}{N - j + 1}
对应修正后的p值为\widetilde{p}_i = \max_{ j \leq i }\{min((N - j + 1)p_{(j)}, 1) \}

从修正后的p值可以明显看出,Holm过程优于Bonferroni过程。

3.3 逐步算法

介绍几种控制FWER的逐步算法。
step-down过程会现将p值排序p_{(1)} \leq p_{(2)}...\leq p_{(N)}。因此如果p_{i}被拒绝,则前面的p值也都会被拒绝。Holm方法是最早的例子之一。
通过closure principle可以将Bonferroni’s bound扩展为Holm’s procedure
如果假设p值间独立,可以得到Simes’ inequality,当全为H0时:
Pr \{ p_{(i)} \geq \frac{\alpha i }{N}\ for\ i = 1 ,2,..., N \} \geq 1 - \alpha
基于Simes’ inequality,Hochberg优化Holm’s adjusted p-values为
\widetilde{p}_i = min( min_{j \geq i} \{ (N - i + 1 ) p_{(j)} \}, 1)
此方案要基于独立前提,它是step-up过程

3.4 排列算法

Bonferroni bound的好处是不用关心p值得相关性,但是如果我们已知了相关性,这就变成了劣势。Westfall和Young将相关性考虑后对Holm的过程进行了优化。
如果将p值排序p_{(1)} \leq p_{(2)} \leq...\leq p_{(N)},用r_1, r_2,...,r_N代表原始的下标:p_{(j)} = p_{r_j}
定义R_j = \{ r_j, r_{j+1} ,..., r_N \}(比p_{j}大的p值的原始下标集合),且
\pi(j) = Pr_0 \{ \min_{ k \in R_j}(P_k) \leq p_{(j)} \}
此处(P_1, P_2, ...,P_N)表示在H0(complete null hypothesis)下观测到(p_1, p_2, ...,p_N)的概率
Westfall–Young step-down min-p定义为
\widetilde{p}_i = \max_{j \leq i} \{ \pi(j) \}
根据Boole’s inequality
\pi_{(j)} \leq \sum_ {k \in R_j} Pr_0 \{ P_k \leq p_{(j)} \} = (N-j+1) p_{(j)}
说明效果好于Holm法。
由于p值计算相对麻烦,也可以用t值替换
\pi(j) = Pr_0 \{ \max_{ k \in R_j} (T_k) \geq t_{(j)} \} (3.38)

现在问题的关键是,如何计算(P_1, P_2, ...,P_N)
带回第2章的例子,X是一个6033 * 102的矩阵,X^*是对它重排列后的矩阵。
定义J^* = (j_1^*, j_2^*, ...,j_n^*),是一个将参加实验人员随机排列后的顺序,对应的
x_{ij}^* = x_{iJ^*(j)}\ \ for\ \ j=1,2,...,n\ \ and \ \ i=1,2,...,N
仍然取前50个与后52个进行计算,得到
T^* = (T_1^*,T_2^*,...,T_N^*)
重复上述过程B(较大的数)轮,可以得到 (3.38)的估计值
\hat{\pi}(j) = \#\{ \max_{ k \in R_j} (T_k^*) \geq t_{(j)} \}/B
这种评估比较科学的原因:

3.5 其它控制标准

FWER是传统多重检验控制规则,但是还有其它,比如:
per comparison error rate: PCER = E{ 错误拒绝数 } / N
excepcted error rate: EER = E{错误决策数(包含两类错误)} / N

Lehmann and Romano’s k-FWER criteria是FWER的变种,目标是控制错误拒绝零假设数不超过k,当k等于1时等于传统FWER。


上一篇下一篇

猜你喜欢

热点阅读