36统计基础- 最大似然
2021-01-09 本文已影响0人
不到7不改名
假设我们给一群老鼠称重。最大似然(Maximum Likelihood)的目标是找到最优的方法来拟合数据的分布。有很多种分布,例如正态分布(Normal),指数分布(Exponential),γ分布(Gamma)等。
你想要将一个分布拟合到你的数据的原因是它更容易处理,也更普遍
- 它适用于每一个相同类型的实验。
在这个例子中,我们认为老鼠的体重最符合正态分布。如果服从正太分布,那么就有以下特点:
-
大多数的测量数据都接近于平均值
-
测量数据在均值的两侧对称分布
现在,我们需要找到最适合这些数据的正态分布。我们绘制一下,不同的正态分布曲线能够覆盖小鼠体重数据的似然(likelihood),黑色的虚线就是正态分布曲线的均值所在位置,从这张图可以看出,红色圈起来的点所在的位置有最大的似然(maximizes the likelihood)观测到小鼠体重。把这个点所在的正态分布曲线提取出来,就是下面的这条曲线。
图片此时,我们就找到均值的最大可能的估计值,就是上面的这个黑色虚线。我们再绘制对标准差的最大可能估计值,如下所示:
图片 图片其中的绿色曲线就是符合我们的小鼠体重数据的曲线,能够最大可能地估计这批数据的均值与标准差,它是最终我们想要的正态分布曲线。此时我们明白,当有人说他们最大可能地估计了均值或标准差的时候,你就知道,你所观察到的东西就是你最大可能所观察所到的东西。
对于大多数人来说,“概率(probability)”和“似然(likelihood)”就是一样的。但是,在我们这个教程里,“似然”专门指的是我们所讲的内容,也就是说,似然指的是,你有一批数据,你要找到符合这个数据的某个分布,寻找方法就是找到这个分布的均值和标准差(我觉得这两个参数只适用于正态分布)。