贝叶斯公式的应用
https://wenku.baidu.com/view/ed558019fad6195f312ba6ac.html
1. 疾病判断
艾滋病检测灵敏度95%,准确率99% 人群中千分之一的人的病 请问测出阳性的人真得病的概率P(B|A)
A={检测出阳性} B={患病}
P(A|B)=0.95 患病的人检查出阳性0.95
P(-A|-B)=0.99 没患病的人检查为阴性0.99
P(A|-B)=0.01 没患病的人检查为阳性0.01
P(B)=0.001 P(-B)=0.999
P(B|A)*P(A)=P(A|B)*P(B) 只需求出P(A)
P(A)=P(A|B)*P(B)+P(A|-B)*P(-B)=0.95*0.001+0.01*0.999
得出P(B|A)=0.087
2. 诉讼
给精神分裂症CAT扫描时 30%脑萎缩 正常人2%脑萎缩 精神分裂症发病率1.5% 欣克利显示出脑萎缩 求精神分裂概率
A={CAT脑萎缩} B={精神分裂症}
P(A|B)=30%
P(A|-B)=2%
P(B)=1.5%
求P(B|A)
P(B|A)=P(A|B)*P(B)/P(A) 需求出P(A)
P(A)=P(A|B)*P(B)+P(A|-B)*P(-B)=0.3*0.015+0.02*0.985=0.0242
P(B|A)=0.3*0.015/0.0242=0.186 无法作为无罪的证据
3. 市场预测
营业人员给出最高、最低、最可能三种预测销售额,求销售额期望
A={货源情况} B={预测销量成功} 求E(A2)
预测的最高销售量成功的概率:P(B1)
预测的最可能销售量成功的概率:P(B2)
预测的最低销售量成功的概率:P(B3)
P(B1|A2)=P(A2|B1)*P(B1)/P(A2)=1/3*0.3/0.4=0.25
P(B2|A2)=P(A2|B2)*P(B2)/P(A2)=0.5*0.4/0.4=0.5
P(B3|A2)=0.25
E(A2)=0.25*B1+0.5*B2+0.25*B3=775
4. 贝叶斯过滤技术
3000封垃圾邮件“mortgage”出现400次,300封正常邮件出现5次 求出现“mortgage”邮件是垃圾邮件的概率
A={垃圾邮件} B={出现} 求P(A|B)
P(B|A)=400/3000
P(B|-A)=5/300
P(A|B)=P(B|A)*P(A)/P(B)
隐含假设 P(A)=P(-A)=0.5
P(B)=0.5*(P(B|A)+P(B|-A))
因此P(A|B)=P(B|A)/[P(B|A)+P(B|-A)]
邮件过滤 token特征串(“mortgage”(抵押),IP地址,域名)
A={邮件为垃圾邮件} ti为含有第i个token特征串
P(ti|A)=垃圾邮件中含ti的概率
P(ti|-A)=正常邮件中含ti的概率
P(A|ti)=P(ti|A)*P(A)/P(ti)
P(ti|A)=垃圾邮件集ti出现率
P(ti|-A)=非垃圾邮件集ti出现率
根据复合概率公式(暗含假设ti间彼此独立):
P(A|t1,t2,...,tn)=P(t1|A)*P(t2|A)*.../[P(t1|A)*P(t2|A)*...+P(t1|-A)*P(t2|-A)*...]
超过阈值则判定为垃圾邮件