独立性假设 与 先验后验

2020-03-01  本文已影响0人  谢小帅

1.机器学习假设训练集样本独立同分布

机器学习建立在当前获取到的历史数据 [训练集],对未来数据进行预测、模拟。

https://www.zhihu.com/question/41222495/answer/790291550

选定模型,优化参数\theta,使 likelihood 最大。

1.1 独立同分布 independent and identical distribution

1.2 likelihood 极大似然估计 MLE

当样本符合独立性假设后,likelihood 转化为 各个样本发生概率之积
l(\theta)=P(x_1,x_2,x_3,...,x_n|\theta)=P(x_1|\theta)*P(x_2|\theta)*...*P(x_n|\theta)

l(\theta) = P(x_1,x_2,x_3,...,x_n|\theta) = \prod_{i=1}^{n} P(x_i|\theta)

likelihood 取 max,再使用 log 将乘法转化为加法,即 条件对数似然,起到简化问题作用

\operatorname*{argmax}_\theta l(\theta) = \operatorname*{argmax}_\theta log(l(\theta)) = \operatorname*{argmax}_\theta \sum_{i=1}^{n} log(P(x_i|\theta))

2.贝叶斯公式与先验后验

参考:https://zhuanlan.zhihu.com/p/38567891

2.1 全概率与贝叶斯

二者互为“逆”定义

2.2 先验 prior 后验 posterior

贝叶斯判断 A 事件的发生源于哪个因素的概率,类比分类问题
此时分母P(A) = P(x)即此样本已经产生
判断这个样本属于哪个类y_i,即P(y_i|x)

先验后验关系
posterior = \frac{prior * likelihood}{evidence}

实例,假设有两个盒子,分别为红色和蓝色。
在红色盒子中放着2个青苹果和6个橙子,在蓝色盒子中放着1个橙子和3个青苹果
假设每次实验的时候会随机从某个盒子里挑出一个水果

现取出1个橘子,求其取自红盒的概率,此例中

P(B=red|F=o) = \frac{P(B=red)*P(F=o|B=red)}{P(F=o)}

3. 朴素贝叶斯 Naive Bayes

朴素贝叶斯分类器 - 维基百科
独立性假设:https://zhuanlan.zhihu.com/p/35605570
https://sylvanassun.github.io/2017/12/20/2017-12-20-naive_bayes/

两个独立性假设上

NB 是生成模型,分子P(C)P(F_1,...,F_n|C)等价于联合分布P(C,F_1,...,F_n)

上一篇 下一篇

猜你喜欢

热点阅读