二项分布的假设检验
2017-05-20 本文已影响1771人
晓健周
2017年5月9日
一天,小明跟小黄说,他能够分辨出可口可乐和百事可乐。小黄第一反应就是不信,因为他觉得可口可乐和百事可乐味道几乎没有区别,还有就是小明经常吹牛。小黄这次想探究下,到底小明这次到底是不是在吹牛。
小黄机智地设置了这么一个实验。他买了两大瓶可乐,一瓶可口,一瓶百事。分别分成了20杯,然后每次拿一杯可口、一杯百事放到小明面前,让小明分辨哪一杯是可口可乐。这么试验了下来,20次里面,小明答对了15次。小明说:"看,我有能力分辨吧,20次才错了5次。那5次只是不小心而已。"小黄说:"平均来说瞎猜能猜对10次,你猜对15次,只是你运气好而已,其实你根本分辨不出两种可乐。"
两人争执不下。
后来,小黄思考了一下,争执的点有两个:
(1)到底能有多大把握认为小明是瞎猜的?
(2)如果再让小明分辨一组可乐,他成功的把握有多大?
私下里学习了一下统计学知识,找到了问题的答案。
先假设小明是瞎猜的,那么小明猜对的次数X服从二项分布。可以根据二项分布的密度函数求出小明猜对0~20次的概率。
从图中的"累计概率"可以看出,如果是瞎猜的话,猜中15次及以上的概率是(1-0.9793)≈0.02。也就是说,仅凭瞎猜,猜对15次及以下的概率极小(大约2%),基本上可以认为小明不是瞎猜的。用心看一下表格就可以知道,只要小明猜对14次及以上,我们就有94%以上的把握断定小明不是瞎猜的。
虽然小明不是瞎猜的,但是他20次只对了15次,那么做单次实验,他猜对的概率是多大呢?
我们知道,伯努利分布的情况下,多次实验之后,频数对接近于概率。从已有的实验数据,我们可以猜测,小明猜对的概率是15/20=75%。
从统计学的角度来说,这是二项分布的参数p的假设检验。
后面我还会写假设检验。