“正态分布”史话!
2020-09-16 本文已影响0人
韩同志
1801年1月,天文学家发现一颗从未见过的小星星,在天空中缓缓移动。6个星期后,它又消失得无影无踪。
这到底是颗什么行星呢?因为仅仅六周的观测数据,是没办法锁定它的轨道的。六周看起来很长,但只占谷神星公转周期的2%,2%的数据对于天文观测来说,少的太不像话。
而且观测的时候,还会产生各种误差,仪器有误差、肉眼有误差、记录有误差……如果不能找到误差的规律,这些误差叠加到一起,就可能会让预测偏差非常大。
《追星》正当所有人都束手无策之时,“数学王子”高斯出手了,他用一支笔计算出了这个天体的运行轨道。
果然,在高斯指定的位置,人们重新找到了它。这就是人类发现的第一颗矮行星——谷神星。
高斯是怎么解决的呢?
首先,他做了个大胆的猜测,假设误差分布的最大可能性就等于这些误差的平均值。然后,再想办法找满足这个假设的函数。
结果意想不到的事情发生了,恰好满足这个假设的函数只有一个,就是“正态分布”公式。
高斯基于正态分布公式,算出了谷神星的位置。
高斯和正态分布从此以后,正态分布席卷一切,推动了数学、统计学、物理学、工程学等众多领域的发展。
正态分布,简单讲就是“正常的分布”。
在正态分布的曲线图里(见图2),横坐标代表随机变量的取值范围,越往右,随机变量的值就越大;纵坐标,则代表概率的大小,越往上概率越大。
正态曲线曲线上任意一点,通过它的横坐标、纵坐标,我们就知道这个值出现的概率是多少。
正态曲线左右对称,中间的最高点,代表平均值出现的概率最大,数据最多;而两边陡峭下降,意味着越靠近平均值,数据越多;越远离平均值,数据就越少。
世界上大多数“不确定性”的事物,都可以用正态分布来描写,小到学生的成绩、人类的身高,大到一个国家贫富人群的分布,都符合正态分布的规律。
掌握“正态分布”这个工具,有助于我们理解现实世界的基本形态,顺势而为,寻求成功。