先验概率, 后验概率, 似然函数, 证据因子

2019-03-16  本文已影响0人  风清云流

先验概率, 后验概率, 似然函数, 证据因子

理论

假设有变量x​y​, x​表示特征, y​表示我们关心的变量, 可以是分类变量或者连续变量. 那么, 关于y​的先验概率为p(y)​, 关于y​的后验概率为p(y|x)​, 似然函数为p(x|y)​, 证据因子p(x)​, 根据全概率公式和贝叶斯公式可以得到它们之间的关系, 预先假设y​m​种取值:
\begin{align} p(y_i|x) &= \frac{p(x,y_i)}{p(x)} \\ &= \frac{p(x|y_i)p(y_i)}{p(x)} \\ &= \frac{p(x|y_i)p(y_i)}{\sum_{j=1}^{m}{p(x|y_j)p(y_j)}}, (1 \leq i \leq m) \end{align}
根据训练样本(包含特征类别), 无法直接求出后验概率, 后验概率需要通过似然函数和先验概率间接求得.

注意: 这里的先验概率和后验概率是相对的, p(x)也可以是先验概率, p(x|y)为后验概率, 只是相对于x​而已.

例子

假设x表示特征, 特征取值范围有: \{阴天, 晴天\}, y表示分类, 取值范围有: \{下雨, 不下雨\}. 现在我们根据"是否阴天"这个随机变量x的观测样本数据(特征样本), 来判断是否会下雨.

根据历史经验估计,

根据现有训练样本可以求得:

参考

先验概率、似然函数、后验概率、贝叶斯公式

上一篇 下一篇

猜你喜欢

热点阅读