频率派 vs 贝叶斯派

2021-02-18  本文已影响0人  elephantnose

对于有 n 个样本的样本集 X = (x_1, ..., x_n) 以及参数 \theta, 那么有 X 服从概率分布 P(x|\theta)

频率派

频率派认为 \theta 是一个未知的常量, 数据 X 是一个随机变量,其服从一定的概率分布, 目的是通过极大似然估计 + 随机变量 X 来估计出未知参数 \theta\theta_{MLE} = argmax_{\theta} ,, log P(X|\theta)

贝叶斯派

贝叶斯派认为 \theta 是一个随机变量,其服从一定的概率分布 p(\theta)。其采用最大后验估计来计算 P(\theta|X)P(\theta|X) = \frac{P(X | \theta) P(\theta)}{P(X)}

\theta_{MAP} = argmax_{\theta} , , P(\theta | X) = argmax_{\theta} P(X|\theta)P(\theta)

2. 极大似然估计 vs 最大后验估计

1. 极大似然估计 - MLE

2. 最大后验估计 - MAP

MAP 的基础是贝叶斯公式: 贝叶斯估计:P(\theta|X) = \frac{P(X | \theta) P(\theta)}{P(X)}= \frac{P(X | \theta) P(\theta)}{\int_{\theta} P(X|\theta)P(\theta)d{\theta}} \ 贝叶斯预测:p(\hat{x} | X) = \int_{\theta} p(\hat{x},\theta|X) d{\theta} = \int_{\theta} p(\hat{x}|\theta) p(\theta|X)d{\theta} MAP 优化的就是后验概率, 目的是通过观测值使得后验概率最大: \theta_{MAP} = argmax_{\theta} , , P(\theta | X) = argmax_{\theta} P(X|\theta)P(\theta)


QA

1. 极大似然估计与最大后验概率的区别?

2. 概率与似然的区别

一般情况,对随机变量的取值用概率表示。而在非贝叶斯统计的情况下,参数为一个实数而不是随机变量,一般用似然来表示。

3. 贝叶斯派与频率学派的区别

上一篇 下一篇

猜你喜欢

热点阅读