11统计基础- 计算P值
计算P值
有两种p值,单侧和双侧。双侧p值是最常见的,重点是计算它们。相反,单侧p值是很少被使用。
p-value由三部分组成:
-
随机的概率会产生观察结果。
-
观察到其他同样罕见的事物的概率。
-
观察到更罕见或更极端事物的概率。
举个例子,我们做掷硬币实验,并提出零假设:即使我连续得到2次正面,我的硬币和普通硬币没有区别。然后我们来计算p值俩检验假设。两次正面朝上的p值等于:两次正面朝上的概率0.25+两次反面朝上的概率0.25+更罕见的概率0=0.5。0.5>0.05,所以我们接受零假设,我的硬币和普通硬币没有区别。
image-20201221155243111.png再来一个例子,提出零假设:即使我得到4次正面1次个反面,我的硬币和普通硬币没有区别。然后我们来计算p值检验假设。4次正面1次个反面的p值等于:四次正面和一次反面的概率5/32 +四次反面一次正面的概率5/32 +五次正面和五次反面的概率2/32 = 0.375。0.375>0.05,所以我们接受零假设,我的硬币和普通硬币没有区别。
然而,实际上,当我们计算概率和p值时对于一些连续的东西,比如高度,我们使用统计分布。下面是1996年15至49岁巴西女性的身高分布。
例如,我们测量一个人的身高是142厘米,我们可能会想,这是否来自于这种分布高度,其平均值为155.7cm。或者它来自于另一个高度分布,例如这个绿色分布有一个平均值142cm。 假设:此测量来自蓝色分布。p值=首先是小于等于142厘米的人群的面积0.025+大于等于169厘米的人群的面积为0.025 = 0.05,它可能来自于蓝色分布,也可能不是。很难判断,因为p值刚好在边界上。
image-20201221160830862.png
如果我们测量身高141cm。假设:此测量来自蓝色分布。p值=0.016+0.016=0.03,0.03<0.05,拒绝假设,此侧量可能来自其他分布。
image-20201221162325293.png
如果我们测量身高在155.4cm到156之间。假设:此测量来自蓝色分布。p值=0.04+0.48+0.48=1,接受假设,此测量来自蓝色分布。
image-20201221162910344.png
接下来的例子将证明单侧p值的危险,想象一下,我们测量一群人需要多长时间才能从一种疾病中康复。我们创造了一种新的超级药物,想看看它是否能帮助人们在更短的时间内康复。如果我们给一群人服用超级药物平均恢复时间是4.5天。双侧p值=0.016+0.016=0.03。由于0.03<0.05,双侧p值告诉我们,超级药物是不同的,这表明其它分布能更好地解释数据。对于单侧检验,p值=0.016。
现在,想象一下超级药物并没有那么好,而且平均需要15.5天恢复。双侧p值=0.016+0.016=0.03。换句话说,无论超级药物是否超级并使事情变得更好,或者如果不那么超级并使事情变得更糟,双侧p值都将检测到异常的发生。单侧p值=0.98。由于未能发现超级药物正在使情况变得更糟,单边p值是很棘手的,应该避免,或者只有真正了解自己在做什么的专家才使用。
image-20201221164205294.png