学习

Bootstrap 2 利用Bootstrap 计算 p-va

2022-01-18  本文已影响0人  数科每日

本展示如何利用 Bootstrap 来计算均值的 p-value, 同理也可以计算其他统计值。

假设在一次测量中, 得到测量值如下图所示, 均值是0.5.

image.png

首先, 我们复习一下 p-value 的定义:

假如Null 假设是正确的, p-value 代表我们看到比当前结果更加极端(违背Null 假设方向)的结果的概率

因此,我们需要先获得一份Null 假设是正确的样本。 在这里, Null 假设是

总体的均值为0

所以, 需要将图中样本的每个测量值, 向左移动 0.5 个单位 (样本均值), 得到:

image.png

然后, 在 Mean=0 的样本上, 对 Mean 进行 Bootstrap 采样, 会的到一个关于均值的分布:

image.png

这个分布的意思是:假如总体均值为0 ,利用样本进行Boostrap 的到的均值分布。 为了得到 p-value, 我们可以统计这个分布中, 0值左右,大于样本均值, 和小于样本均值的数据点占比(<-0.5, >0.5)。 这正好符合了 p-vlaue “更加极端” 的定义。

在上图中, (<-0.5, >0.5)的数据点占比 0.63, 那么p-value 就是0.63。

image.png
上一篇下一篇

猜你喜欢

热点阅读