统计基础3-抽样分布

2019-12-27  本文已影响0人  百分号

意味着, 我们可以通过计算机从一个分布的直方图或者近似曲线的概率中选取一个随机数.

Figure1

有时, 我们的样本会从黑色方框标记的区域产生.

Figure2

还有些时候, 样本会从边缘区域产生.

为了进行统计探索. 计算机可以抽样出很多样本, 而我们可能将这些样本代入到统计检验(statistics tests)中, 去探索会发生什么.

正是由于我们在抽样前知道原始分布是什么, 我们可以比较期望值与实际值.

Figure3

如Figure3所示, 两组样本来自于同一个分布, t-test对应的p\_value为很大, 即二者并没有显著性差异.通过多次(大量)t-test, 我们可以得到p\_value值比较大的频率有多大.

Figure4

这时t-test会得到比较小的p\_value, 意味着两次抽样存在着显著性差异. 如果我们抽取了很多样本, 然后做了很多次t-test, 我们可以观察p\_value值比较小的频率有多大.通过p\_value值的频率统计, 可以告诉我们, 我们是否需要增加样本量.

总结

我们从一个单分布或多个混合分布中抽取样本, 即通过计算机生成一堆随机数字, 可以使我们知道统计检验在不需要做大量工作的情况能做什么.

上一篇 下一篇

猜你喜欢

热点阅读