007第四十三篇：最大似然估计步骤统计学（20）

2018-06-06 本文已影响0人 milk76

似然（likelihood）：过去的可能性。

最大似然估计（maximum likelihood estimation）：是一种统计方法，它用来求一个样本集的相关概率密度函数的参数。

“现实的就是合理的，合理的就是现实的”。——黑格尔

最大似然估计可以分为八步。跟显著度检验相似，每一步都要看清楚，否则就会“迷路”的。

第一步，放弃研究假设，设立零假设，假定自变项与因变项之间在总体系统中无关。设立“零假设”使用反证法，为了放弃它。

第二步，以零假设为基础，算出样本统计值出现的似然性（概率值），取似然性的自然对数，再乘以-2。绕个弯子的理由是得出来怪数（似然性自然对数的负2倍，-2ln likehood），这个数的分布与卡方值的分布相似，可以当卡方值的代用品。

第三步，以上述得到似然性自然对数的负2倍为指标，查卡方值，得出假设是否成立的概率。概率P＜0.05（0.001）便放弃零假设。注意，这里又一个新的零假设，是关于模型与数据的契合度（goodness-of-fit，拟合优度）的。这个零假设是：作为一个模型，初始估计与数据天衣无缝，完美锲合，零误差。

第四步，如果不能放弃关于初始模型的零假设（即，自变项与因变项无关）则研究无疾而终。

第五步，如果有信心放弃关于初始模型的零假设，研究继续进行，提出替代假设。

第六步，提出替代假设的依据是把初始模型预测结果与样本中观察到的情况（统计值）进行对比，即比较交叉表中预期值与观察值。预期值大于观察值，就把回归系数从0调至负数；预期值小于观察值就把回归系数由0调到正数。

第七步，以似然性自然对数的负二倍为指标，决定替代模型是否比初始模型更符合数据。看看记录最大似然估计过程的估计记录（iteration history迭代史），迭代模型指标一定小于初始模型指标。

第八步，不断修正替代模型，即不断增大回归系数绝对值，直到模型与数据的契合度不再“显著”改进。

至此，最大似然估计大功告成。

007第四十三篇：最大似然估计步骤 统计学（20）