贝叶斯实现垃圾邮件分类(Python)

2020-04-07  本文已影响0人  学人工智能的菜菜

接下来可能慢慢进入了机器学习的旅程,可能要面临更大的跳转,希望坚持。

读计算机专业的学生都知道,贝叶斯定理不陌生,是我们大学的概率论统计学里第一章就学习的东西,可想而知,这定理是有多重要。
咱们先来惠顾一下贝叶斯定理如何推理出来的。
由于贝叶斯公式是由全概率公式和乘法公式得到的,所以我们先看看全概率公式和乘法公式。

全概率公式

  1. 如果事件组B1,B2,。。。满足1.B1,B2。。。。两两互斥,即 Bi ∩ Bj = ∅ ,i≠j , i,j=1,2,。。。,且P(Bi)>0,i=1,2,....;
    2.B1∪B2∪。。。=Ω ,则称事件组 B1,B2,。。。是样本空间Ω的一个划分
    设 B1,B2,。。。。是样本空间Ω的一个划分,A为任一事件,则:
    P(y) = \sum_{i=0}P(xi) P(y|xi)
    因乘法公式是由条件概率公式可得,所以

条件概率

设A,B是两个事件,且P(B)>0,则在事件B发生的条件下,事件A发生的条件概率(conditional probability)为:
P(y|x)=P(xy)/P(x)

乘法公式

1.由条件概率公式得:
P(xy) = P(y|x).P(x) = P(x|y).P(y)

贝叶斯公式

由全概率公式和乘法公式可得
P(y|x) = \ \frac{ P(x|y).P(y)}{P(x)} =\ \frac{ P(y|x).P(x)}{P(y)} =\ \frac{ P(y|x).P(x)}{\sum_{i=0}P(xi) P(y|xi))}

垃圾邮件分类

贝叶斯算法是监督学习,所以在以往的邮件来往中,有多少正常邮件和垃圾邮件已做过统计
问:如果来一封新的邮件,如何判断是什么邮件,垃圾邮件?正常邮件?


image.png

比如咱们用判断该邮件是否是广告邮件即为垃圾邮件。


image.png

加油鸭,希望就在前方。

上一篇下一篇

猜你喜欢

热点阅读