R语言与统计分析高等数学python数学应用

贝叶斯公式

2020-04-20  本文已影响0人  可达数学

如果你看到一个人总是做一些好事,那个人多半是个好人。

贝叶斯公式

众所周知,我有几个医生朋友。他们在为病人治疗的时候,最常规的动作就是要求病人去做各种检查。这其中的道理是显而易见的,即一种检测为阳性,并不能说明病人必然患有疾病。只有通过多种检测,才能更好、更有把握地判断病人的病情。用更抽象一点的语言描述,就是当你不熟悉某个事物的属性时,可以通过观察与该属性相关的事件出现的多寡去判断该属性存在的概率。支持某项属性的事件发生得越多,则该属性成立的可能性就越大。用数学的语言,就是贝叶斯公式:
P(A|B)=\frac{P(B|A)P(A)}{P(B)}
这里的P(A|B)表示事件B发生时事件A发生的概率,P(B|A)表示事件A发生的条件下事件B发生的概率。对于没有学过概率的人来说,或许贝叶斯公式还不够直观。如果我们把公式中的A换成规律(也就是是否具有某种属性),B换成现象(也就是观察到的相关事件),则公式贝叶斯公式就变成了:
P(\text{规律}|\text{现象})=\frac{P(\text{现象}|\text{规律})P(\text{规律})}{P(\text{现象})}
上面的公式表明,贝叶斯公实际上是一个由现象得到规律的方法,这也正是我们在现实世界里所做的。

贝叶斯公式的应用

让我们回到一开始的疾病检测问题,让我们看下面这个例子:

一种癌症,现有一种检测技术(甲技术),得了这个癌症的人被检测出为阳性的几率为95%,未得这种癌症的人被检测出为阳性的概率为1%,而人群中得这种癌症的几率为0.5%,一个人被检测出阳性,问这个人得癌症的几率为多少?

我们用A表示“测出为阳性”,B_1表示“患此癌症”,B_2表示“未患病”,则我们想要求得是P(B_1|A)
由题意,我们知道
\begin{split} P(B_1)=0.005,\ P(B_2)=0.995,\\ P(A|B_1)=0.95,\ P(A|B_2)=0.01. \end{split}
由全概率公式,我们知道
\begin{split} P(A)&=P(A|B_1)P(B_1)+P(A|B_2)P(B_2)\\ &= 0.005\times 0.95 + 0.995\times 0.01\\ &=0.0147 \end{split}
由贝叶斯公式,
P(B_1|A)=\frac{P(A|B_1)P(B_1)}{P(A)}\approx 32.3\%
这说明,即便检测技术非常靠谱,结果正确的概率非常高,检出阳性的情况下,患病的概率依然远远低于不患病的概率。

故事并没有到此结束,我们假设同时进行了另一项检测(乙检测),乙检测的成功率与上面的甲检测完全相同,若乙检测也为阳性,此时的该人患病的概率是多少呢?
这时候,我们只需要将上面所有公式中的P(B_1)换成0.323, P(B_2)换成1-0.323=0.677即可,患病的概率会变为97.84\%.

类似地,如果继续进行更多的检测,就可以对该人是否患病给出更有把握的回答。

这才是贝叶斯公式的强大之处!

思考: 如果一枚筛子,投了100次都是6点,你能得出什么结论?

欢迎大家关注我的公众号:数学知识派。


上一篇下一篇

猜你喜欢

热点阅读