36统计基础- 最大似然

2021-01-09 本文已影响0人不到7不改名

假设我们给一群老鼠称重。最大似然(Maximum Likelihood)的目标是找到最优的方法来拟合数据的分布。有很多种分布，例如正态分布（Normal），指数分布（Exponential），γ分布（Gamma）等。

你想要将一个分布拟合到你的数据的原因是它更容易处理，也更普遍

它适用于每一个相同类型的实验。

在这个例子中，我们认为老鼠的体重最符合正态分布。如果服从正太分布，那么就有以下特点：

大多数的测量数据都接近于平均值
测量数据在均值的两侧对称分布

现在，我们需要找到最适合这些数据的正态分布。我们绘制一下，不同的正态分布曲线能够覆盖小鼠体重数据的似然（likelihood），黑色的虚线就是正态分布曲线的均值所在位置，从这张图可以看出，红色圈起来的点所在的位置有最大的似然（maximizes the likelihood）观测到小鼠体重。把这个点所在的正态分布曲线提取出来，就是下面的这条曲线。

图片

此时，我们就找到均值的最大可能的估计值，就是上面的这个黑色虚线。我们再绘制对标准差的最大可能估计值，如下所示：

图片

其中的绿色曲线就是符合我们的小鼠体重数据的曲线，能够最大可能地估计这批数据的均值与标准差，它是最终我们想要的正态分布曲线。此时我们明白，当有人说他们最大可能地估计了均值或标准差的时候，你就知道，你所观察到的东西就是你最大可能所观察所到的东西。

对于大多数人来说，“概率（probability）”和“似然（likelihood）”就是一样的。但是，在我们这个教程里，“似然”专门指的是我们所讲的内容，也就是说，似然指的是，你有一批数据，你要找到符合这个数据的某个分布，寻找方法就是找到这个分布的均值和标准差（我觉得这两个参数只适用于正态分布）。

36统计基础- 最大似然

猜你喜欢

热点阅读