用python解释中心极限定理
2018-09-25 本文已影响8人
IntoTheVoid
核心思想: 对于任意分布, 无论形状如何, 在中心极限定理下其总体的抽样分布, 均为正态分布
假设现有一个γ分布, 代码如下:
np.random.seed(42)
pop_data = np.random.gamma(1,100,3000)
plt.hist(pop_data);
image.png
每次抽取样本量为100的样本, 共重复10000次, 绘制直方图可得下图
means_size_100 = []
for _ in range(10000):
sample = np.random.choice(pop_data, 100)
means_size_100.append(sample.mean())
means_size_100 = np.array(means_size_100)
plt.hist(means_size_100);
image.png
对比总体和抽样分布的均值可得
- 总体
pop_data.mean(), pop_data.var()
(100.35978700795846, 9955.76939306549)
- 抽样分布
means_size_100.mean(),means_size_100.var()
(100.51520135024997, 98.81491650084328)
结论:总体均值与抽样分布均值接近, 说明,抽样分布来自于总体, 且呈现正态性,不止时对γ分布, 对于任何一个分布,不论形状如何, 其抽样分布都拥有正态性, 不过前提是要满足大数定理
特例:如果样本量为1, 那么不存在样本均值