有了这个工具,你也可以预测未来
之前我们聊过小数定律,今天一起看下统计概率中的第1大护法:大数定律。
大数定律是我们从统计数字中推测真相的理论基础。
大数定律说如果统计数据足够大,那么事物出现的频率就能无限接近他的期望值。
那么,什么是事物的期望呢?
在我们的生活中,期望是你希望一件事情预期达到什么样的效果。例如,你去面试,期望的薪水是1万5。
在统计概率里,期望也是一样的含义,表示的也是事件未来的预期值,只不过是用更科学的方式来计算出这个数值。
某个事件的期望值,也就是收益,实际上是所有不同结果的和,其中每个结果都是由各自的概率和收益相乘而来。
到这里,你会说:猴子,请说人话。
我还是用例子来说明如何计算期望。
假设你参与了一个掷骰子的游戏,游戏规则是掷出1点可以获得1元,掷出2点可以获得2元,掷出3点可以获得3元,以此类推。
那么在这个游戏中,掷一次骰子的期望值是多少?
前面的概率计算我们已经抛筛子有6种结果,每一个结果的概率都是1/6,因此期望值为:
1/6*1元+1/6*2元+1/6*3美元)+1/6*4元+1/6*5元+1/6*6元
=3.5元
这个期望3.5元代表什么意思呢?
也就是说只要你持续玩下去,你每次游戏的预期收益是是3.5元。
可能你某一次抛筛子赢了1元,某一次抛筛子赢了6元,但是长期来看,你平均下来每次的收益会是3.5元。
其实,通过刚才计算期望的公式,我们可以看出来:期望的本质是概率的平均值。
下面是这个抛筛子游戏的演示过程:
大数定律说如果统计数据足够大,那么事物出现的频率就能无限接近他的期望。
这里的图片是扔100次筛子的期望图,横轴是扔筛子的次数,纵轴是筛子抛出点数的期望。
我们看到当在扔筛子次数很少,少于60次的情况下,抛出点数波动很大。这就是小数定律,如果统计数据很少,那么事件就表现为各种极端情况,而这些情况都是偶然事件,跟它的期望值一点关系都没有。
但是随着抛出次数的增加,最终抛出点数的期望是3.5。和我们刚才计算出的期望数值的一样的。
粗略看一下,抛出筛子点数是3.5的期望似乎是一个无效数据,毕竟筛子每一面的数值是整数,而不是小数。
但是,期望是一个非常有用的参考数据,就像刚才我们说的抛筛子游戏,你可以通过比较成本投入和期望收益,你就能知道做这件事是不是“值得”。
如果在上述游戏中,每掷一次骰子需要缴纳5元,你还玩吗?
根据大数据定律,如果统计数据足够大,那么事物出现的频率就能无限接近他的期望,也就是只要你一直持续玩下去,你每次游戏的预期收益是3.5元。
如果你玩1万次这个游戏,投入成本5元乘以1万次是5万元,而预期收益3.5元乘以1万次是3.5万元,那么你将输掉的是5万元-3.5万元等于1.5万元。这种赔本的游戏你还敢玩吗?
这也可以解释为什么买彩票,长期来看是一种赔本的游戏。彩票从本质上来看其实就是一种赌博行为。
我们也可以用大数定律来解释为什么赌场从长期来看总是挣钱的问题。
赌场内所有项目的概率都是有利于赌场老板的(出“老千”的赌客不考虑在内)。如果赌场的营业时间足够长,吸引的下注人数也足够多,那么赌场从赌桌赚到的钱肯定要比付出的要多。
1.什么是大数定律?
如果统计数据足够大,那么事物出现的频率就能无限接近他的期望值。
2.什么是期望?
某个事件的期望值,也就是收益,实际上是所有不同结果的和,其中每个结果都是由各自的概率和收益相乘而来。
期望的本质是概率的平均值。