通俗理解系列 | 极大似然估计
2020-04-01 本文已影响0人
yuanCruise
极大似然估计是一种机器学习领域的重要思想,是一种参数估计的算法。该算法理论思想意义重于实际应用。在真实的应用中,多是参考其思想进行拓展的。接下来我将用通俗的语言和例子带你逛一遍极大似然估计。
当然再通俗,这毕竟是一个概率论的知识,在这之前你需要有正态分布的知识。若你对正态分布不了解,请出门左转,到搜索引擎中搜索“正态分布”,补完课再回来哈。
现在假设有一个不规则的骰子,一共有6面,分别是1,2,3,4,5,6,没投一次骰子出现每个数字的概率是暂时未知的,在这种情况下我们是否有办法得到这个不均匀骰子每次投掷出6个数字的概率分布呢?我们当然不能准确的获取每个数字的概率,但我们可以近似获取。首先我们建立一个正态分布模型作为表征这个不规则骰子每个数字发生概率的模型。如下图所示,现在假设有如下三个概率模型,分别为均值1,2,0,方差2,2,2的三个正态分布。我们现在就需要用极大似然估计的方法来确定哪组参数最适合用于建立当前骰子的模型。

这个时候小明同学为我们做出来巨大的贡献,小明同学出于好奇用这个不规则的骰子投了四次,实验结果分别是:3,3,2,4。在这种情况下,我们分别假设上述三个分布是正确的分布的情况下,计算此时概率值。

如上图所示,最终在均值为2方差为2的正态分布假设下,概率值最大。这个时候我们就估计当前适合骰子结果概率分布的模型为参数为均值2方差2的正态分布。而上述这种通过小明给出的实验结果进行最大化概率的计算,从而估计参数的方法就是极大似然估计喽~
上述正态分布图制作的python代码,公众号后台回复【正态分布】获取~