对普通人一生最有用的概率统计学公式
所长林超在《开窍》一书中说,如果要说对普通人一生最有用的概率统计学公式,那应该是贝叶斯公式。
贝叶斯公式
P(B|A)= P(A|B) x P(B) / P(A)
公式中AB分别代表一件事情的发生,P表示概率。P(B|A)的意思是基于A发生的B的概率。
假设B为患艾滋病,A为检测出阳性。P(B|A)的意思就是,一个人检测出阳性了,他实际患艾滋病的概率。
有一个案例,
一个人被检测出了HIV阳性,他实际患病的概率是多大呢?
假设整个人群感染 HIV 的概率是 0.08%。这家医院使用的检测方法对已经确诊携带 HIV 病毒的病人检测出阳性的概率是 99% (true positive rate),对没有携带 HIV 病毒的人检测呈阴性的概率是 99% (true negative rate)。
按照贝叶斯公式计算,
P(B|A)= P(A|B) x P(B) / P(A)
检测出了HIV阳性实际患病的概率
= 已经携带 HIV 病毒的病人检测出阳性的概率 x 全体人患艾滋病的概率 / 全体人检测出阳性的概率
=99% x 0.08% / ((1-0.08%)x1% + 0.08%x99% )
=7.34%
答案是 7.34%。有点超出意外吧,重点就在超低的基础概率和相对高的误检率上。
另外一个简单而自然的算法是假设总共有 10000 人,由于 HIV 发病率是 0.08%,所以总共有 8 个人携带 HIV 病毒。由于没有携带 HIV 病毒的人检测呈阴性的概率是 99% ,所以这家医院使用的检测方法有 1% 的概率会导致没有携带 HIV 病毒的人被检测呈阳性,即 10000 人中总共会有 (10000 - 8) x 1% = 99.92 人实际上没有携带 HIV 病毒,但检测出了阳性。针对己确诊患病的 8 人中,会有 8 x 99% = 7.92 人检测呈阳性。所以,小李携带 HIV 病毒的概率是 7.92 / (99.92 + 7.92) = 7.34%。