STATISTICS

用python解释中心极限定理

2018-09-25  本文已影响8人  IntoTheVoid

核心思想: 对于任意分布, 无论形状如何, 在中心极限定理下其总体的抽样分布, 均为正态分布

假设现有一个γ分布, 代码如下:

np.random.seed(42)

pop_data = np.random.gamma(1,100,3000)
plt.hist(pop_data);
image.png

每次抽取样本量为100的样本, 共重复10000次, 绘制直方图可得下图

means_size_100 = []
for _ in range(10000):
    sample = np.random.choice(pop_data, 100)
    means_size_100.append(sample.mean())
means_size_100 = np.array(means_size_100)
plt.hist(means_size_100);
image.png

对比总体和抽样分布的均值可得

pop_data.mean(), pop_data.var()
(100.35978700795846, 9955.76939306549)
means_size_100.mean(),means_size_100.var()
(100.51520135024997, 98.81491650084328)

结论:总体均值与抽样分布均值接近, 说明,抽样分布来自于总体, 且呈现正态性,不止时对γ分布, 对于任何一个分布,不论形状如何, 其抽样分布都拥有正态性, 不过前提是要满足大数定理

特例:如果样本量为1, 那么不存在样本均值

上一篇下一篇

猜你喜欢

热点阅读