统计-什么是假阳性
2018-06-20 本文已影响89人
PriscillaBai
一 什么是假阳性
1.
- 在一个符合正态分布的样本中随机抽样,每次抽取三个样本,一共抽两次
-
如图中的小蓝和小红两组,他们的数据有重叠,P值>0.05
2.
- 但是,存在这种抽取情况,即使是随机抽取,两组的数据仍不重叠,P值<0.05
-
这就叫假阳性FDR。 检测一次,犯错的概率为5%,检测1000次,犯错概率为50次
image.png
3.
做1000次实验,观测图2的P值柱状图。发现有很多P值小于0.05,这些就是假阳性。


二 怎么矫正假阳性
本杰明矫正:严厉的惩罚了假阳性,过于激烈
先得到所有P值

1 将P值从小到大排序

2 最大的P值还是原来的数值

3 第二大的P值经过公式计算矫正,依次类推,一直算到最小的P值

