StatQuest学习笔记分享

31统计基础- 二项分布与检验

2021-01-06  本文已影响0人  不到7不改名

我们将会使用二项分布(Binomial Distribution)模拟没有偏好时的预期结果。如果模型不合适,我们就会拒绝认为两种口味的人都受到同样的喜爱。

让我们从一个超级简单的例子开始,假设我问了三个人他们是否更喜欢橙色芬达比葡萄芬达。假设他们有50%的机会选择橘子,50%的机会选择葡萄。然后我们可以计算两个人随机选择橘子,有1个人随机选择葡萄的概率。一共有三种情况,每种情况的的可能性:0.50.5*0.5=0.125,3个人中有2个人会说他们更喜欢橙色芬达的概率是0.375。

image-20201228120201111.png

或者,我们可以用公式来计算,x是喜欢橙色芬达的人数,x=2。n是我们问的总人数,n = 3。n-x是喜欢葡萄芬达的人数。p是某人选择橙色芬达的概率,p= 0.5。1-p是某人选择葡萄芬达的概率。

image-20201228120340248.png

公式中的第一部分是计算:三人中有两人说他们更喜欢橙色芬达的情况。

image-20201228121058466.png

公式的第二部分是计算:三人中有两人说他们更喜欢橙色芬达的概率。

image-20201228121339914.png

公式的第三部分是计算:三人中有一人说他们更喜欢葡萄芬达的概率。

image-20201228121503537.png

3个人中有2个人会说他们更喜欢橙色芬达的概率是:

image-20201228121628648.png

现在我们已经知道我们可以用二项分布(Binomial Distribution)计算概率了,让我们回到我们最初的问题"如果4个人说他们喜欢橙色芬达,3个人说他们喜欢葡萄芬达,我们能否得出这样的结论:人们普遍更喜欢橙色芬达?”

首先我们用二项分布计算4个人说他们喜欢橙色芬达,3个人说他们喜欢葡萄芬达的概率:

image-20201228121957555.png

当你用二项分布来计算p值时,这叫做二项检验(Binomial Test)。p值是观测数据的概率(7个人中有4个人更喜欢橙色芬达),加上所有其他同样可能或更罕见的可能性。概率相等或更少的事件的所有组合的概率之和=0.5 +0.5=1。也就是说,7个人中有4个人更喜欢橙色芬达,他们的p值=1。这意味着模型,二项分布的p= 0.5,(即:橙味芬达和葡萄味芬达都很受欢迎),很适合观察到的数据。

因此,我们得出结论:在样本大小为7的情况下,橘味芬达和葡萄味芬达同样受欢迎。

image-20201228122420548.png
上一篇下一篇

猜你喜欢

热点阅读