StatQuest学习笔记分享

38统计基础- 为什么除以n会低估了方差

2021-01-10  本文已影响0人  不到7不改名

为了理解为什么除以n会低估总体方差(population mean),我们会从几个简单的例子开始,然后用数学证明,一劳永逸地。

在第一个简单的例子中,我想用0替换样本均值(sample mean)x,看看会发生什么。现在我们把测量值和0之间的差值平方,然后计算平均。现在我们把这个值画出来。

image-20201229134837668.png

当x为样本均值时方差最小,当x为总体均值时,方差要大于当x为样本均值时。也就是说,使用样本均值时,低估了总体均值的方差。

image-20201229135245569.png

现在,我们可以对公式求导,用它来确定v在不同值处曲线的斜率。当斜率为0时,我们就能求出方差最小的v值。提醒大家一下,导数对应的是紫色直线的斜率。我们想求出v的值,使紫色线的斜率为0,因为这是我们能求出的最小方差。为了使这个问题更清楚,我们将用三种不同的方法来求导数为零和方差最小的地方。

image-20201229140033140.png

第1种,我们将使用观测数据,找到方差最小的地方。

我们做的第一件事是把n代入5,因为我们有5个测量值。然后计算当斜率为0时,v的值。

image-20201229140656950.png

当v=17.6,方差最小。我们发现当v为样本平均值时方差小于当v为总体均值的方差。

image-20201229141001429.png

第2种,我们就会找到任何5个测量值,方差最小的地方。

把n代入5,因为我们有5个未知测量值。然后计算当斜率为0时,v的值。

image-20201229141145257.png
我们发现不管我们5个测量值是多少,当v为样本均值时,方差最小

第3种,我们会讲如何求出任意样本的最小方差,不管样本大小如何。

当我们有n个测量值的样本。然后计算当斜率为0时,v的值。

image-20201229141437723.png

我们发现不管有多少个测量值,当v为样本均值时,方差最小

结论:因此,当我们除以n时,样本均值的方差总是小于总体均值的方差。除非样本均值和总体均值完全相同,这几乎不会发生。

image-20201229141733970.png
上一篇下一篇

猜你喜欢

热点阅读