40统计基础- 正态分布的最大似然
2021-01-11 本文已影响0人
不到7不改名
下图是正态分布(normal distribution)的方程,有两个参数。第一个参数是希腊字母μ,它决定了正态分布平均值(mean)的位置,μ的值越小,分布的均值就会向左移动,μ的值越大,分布的均值就会向右移动。第二个参数是希腊字符σ,它是标准差(standard deviation),决定了正态分布的宽度。我们将会使用似然去寻找μ和σ的最优值。
![](https://img.haomeiwen.com/i25231873/09a813b21e8d2e0c.png)
让我们从最简单的数据集:一个测量值开始。我们测量了一只老鼠的重量为32g。我们可以将μ= 28 、σ=2的正态分布覆盖到数据上。为了确定给定这条曲线的数据的似然,我们可以将这些数字代入似然函数中。
![](https://img.haomeiwen.com/i25231873/82a882a8dce2ac1e.png)
现在我们可以将分布向右平移一点,μ= 30,然后计算似然(Likelihood)。将这些数字代入似然函数中。然后我们可以代入一大堆μ值,看看哪个给出最大似然。然后将似然的值画成图,我们可以通过确定曲线的斜率为0的位置,来确定似然图中的峰值。然后我们可以代入一大堆σ值,看看哪个给出最大似然,以及μ。然后将似然的值画成图,我们可以通过确定曲线的斜率为0的位置,来确定似然图中的峰值,以及σ。
![](https://img.haomeiwen.com/i25231873/85f8c5fb46c008e8.png)
![](https://img.haomeiwen.com/i25231873/e396961da6c90332.png)
![](https://img.haomeiwen.com/i25231873/b69f5510d70795ef.png)
既然我们知道了如何计算一个正态分布的似然,我们有不止一个测量(我们只是把单个的似然相乘),让我们计算最大似然来估计μ和σ。当我们有n个测量值时,计算似然的函数等于:
![](https://img.haomeiwen.com/i25231873/2a804ebedec7712b.png)
我们需要分别对μ和σ求导,在我们求导之前,我们分别对两边求log。对于μ和σ,似然函数和似然函数的对数都在相同的值处达到峰值。
![](https://img.haomeiwen.com/i25231873/f817c122e7d8568b.png)
然后化简,对μ和σ求导,然后令斜率=0。
![](https://img.haomeiwen.com/i25231873/76b723d27b126807.png)
![](https://img.haomeiwen.com/i25231873/851c6454c015874e.png)