贝叶斯公式的应用

2020-06-22  本文已影响0人  人间桑

https://wenku.baidu.com/view/ed558019fad6195f312ba6ac.html

1. 疾病判断

艾滋病检测灵敏度95%,准确率99% 人群中千分之一的人的病 请问测出阳性的人真得病的概率P(B|A)

A={检测出阳性} B={患病}

P(A|B)=0.95 患病的人检查出阳性0.95

P(-A|-B)=0.99 没患病的人检查为阴性0.99

P(A|-B)=0.01 没患病的人检查为阳性0.01

P(B)=0.001 P(-B)=0.999

P(B|A)*P(A)=P(A|B)*P(B) 只需求出P(A)

P(A)=P(A|B)*P(B)+P(A|-B)*P(-B)=0.95*0.001+0.01*0.999

得出P(B|A)=0.087

2. 诉讼

给精神分裂症CAT扫描时 30%脑萎缩 正常人2%脑萎缩 精神分裂症发病率1.5% 欣克利显示出脑萎缩 求精神分裂概率

A={CAT脑萎缩} B={精神分裂症}

P(A|B)=30%

P(A|-B)=2%

P(B)=1.5%

求P(B|A)

P(B|A)=P(A|B)*P(B)/P(A) 需求出P(A)

P(A)=P(A|B)*P(B)+P(A|-B)*P(-B)=0.3*0.015+0.02*0.985=0.0242

P(B|A)=0.3*0.015/0.0242=0.186 无法作为无罪的证据

3. 市场预测

营业人员给出最高、最低、最可能三种预测销售额,求销售额期望

A={货源情况} B={预测销量成功} 求E(A2)

预测的最高销售量成功的概率:P(B1)

预测的最可能销售量成功的概率:P(B2)

预测的最低销售量成功的概率:P(B3)

P(B1|A2)=P(A2|B1)*P(B1)/P(A2)=1/3*0.3/0.4=0.25

P(B2|A2)=P(A2|B2)*P(B2)/P(A2)=0.5*0.4/0.4=0.5

P(B3|A2)=0.25

E(A2)=0.25*B1+0.5*B2+0.25*B3=775

4. 贝叶斯过滤技术

3000封垃圾邮件“mortgage”出现400次,300封正常邮件出现5次 求出现“mortgage”邮件是垃圾邮件的概率

A={垃圾邮件} B={出现} 求P(A|B)

P(B|A)=400/3000

P(B|-A)=5/300

P(A|B)=P(B|A)*P(A)/P(B)

隐含假设 P(A)=P(-A)=0.5

P(B)=0.5*(P(B|A)+P(B|-A))

因此P(A|B)=P(B|A)/[P(B|A)+P(B|-A)]

邮件过滤 token特征串(“mortgage”(抵押),IP地址,域名)

A={邮件为垃圾邮件}  ti为含有第i个token特征串

P(ti|A)=垃圾邮件中含ti的概率

P(ti|-A)=正常邮件中含ti的概率

P(A|ti)=P(ti|A)*P(A)/P(ti)

P(ti|A)=垃圾邮件集ti出现率

P(ti|-A)=非垃圾邮件集ti出现率

根据复合概率公式(暗含假设ti间彼此独立)

P(A|t1,t2,...,tn)=P(t1|A)*P(t2|A)*.../[P(t1|A)*P(t2|A)*...+P(t1|-A)*P(t2|-A)*...]

超过阈值则判定为垃圾邮件

上一篇下一篇

猜你喜欢

热点阅读