什么是概率?
1 争论
概率论需要回答的第一个问题就是,什么是概率?
刚接触这门学科的同学可能觉得难以置信,这个问题仍然存在着广泛的争论:

而且这个问题更像是一个哲学问题,而不是数学问题,确实也有不少哲学家参与讨论。
对于概率的定义有几个主流的派别:
频率派
古典派
主观派
了解这些派别对于理解概率论很有帮助,下面来简单介绍一下。
2 频率派
首先来了解下频率派,频率派的理论基础是对过去事实的归纳总结。
2.1 什么是频率?
学概率从抛硬币开始才是正确姿势。我们知道硬币是有正反两面:

硬币抛出之后:

电影《老无所依》
得到的结果是随机的,那么得到正面的概率是多少呢?这里的“概率”又指的是什么?
我们扔100次硬币试试:

扔硬币的正反次数
可以看到,得到48次正面,52次反面,用正面次数除以总的次数:

"P100(正面)"称为扔100次硬币时,正面出现的频率。
2.2 频率与概率
2.2.1 频率稳定性
同样的,扔n次硬币时如果出现了nH次正面,那么:

"P100(正面)"为此时正面出现的频率。历史上很多数学家都做过扔n次硬币的实验:

从试验结果可见,随着n的增大,频率越来越趋近于0.5。可见,虽然单次扔硬币的结果是随机的,但多次重复后频率趋于稳定,这种稳定性也称为频率稳定性,反应了扔硬币存在某种必然性。
2.2.2 定义
频率派认为如果频率存在稳定性,即当 n ->∞时下面极限存在,就得到了概率(用Probability的首字母P来表示):

可以自己尝试扔一下,点一下按钮就会模拟扔100次硬币,看看是不是扔的次数越多,越趋于0.5(计算机模拟的,内部使用的是伪随机,难免会有一些偏差):

GeoGebra 互动操作
此处为GeoGebra互动内容,体验请访问马同学高等数学 什么是概率
3 频率派的缺点
通过频率来定义概率的方法比较符合直觉,但缺陷也很明显:
首先,需要 n 足够大,但是“足够大”这个词很含糊
其次,需要在相同条件下反复扔硬币,但是“相同条件”这个词也很含糊,也很难保证,比如扔了10000次后,硬币上沾满汗水,那又怎么办?
再次,永远也不可能扔无限次硬币,所以得到的概率始终是一个近似值
最后,有些时候根本不具备反复实验的条件,比如火山喷发的概率应该怎么计算?

火山喷发的概率
4 古典派
接下来介绍古典派,古典派的理论基础是不充分理由原则。
4.1 不充分理由原则
在概率论草创阶段,雅各布·伯努利(1654-1705):

雅各布·伯努利(1654-1705)
就提出,如果因为无知,使得我们没有办法判断哪一个结果会比另外一个结果更容易出现,那么应该给予它们相同的概率。比如:
硬币:不清楚硬币哪一面更容易出现,那么应该给予正面、反面相同的概率,即为1/2
骰子:不清楚骰子哪一面更容易出现,那么应该给予每一面相同的概率,即为1/6
此称为不充分理由原则(Insufficient Reason Principle)。
4.2 古典概率
以不充分理由原则为基础,经由拉普拉斯(皮埃尔-西蒙·拉普拉斯侯爵,1749-1827):

皮埃尔-西蒙·拉普拉斯侯爵,1749-1827
之后,确立了古典概率的定义,即:未知的概率都为等概率
在这之后,古典概率在整个19世纪也被人们广泛接受,我们高中学习的概率,基本都是古典概率。
比如,有一家原木加工厂,它会把木头切成不同的木方,木方的截面都是正方形,边长会在1~3尺之间随机浮动:

那么根据古典概率,正方形边长在1~2尺之间的概率为多少?
根据古典概率的不充分理由原则,我们没有办法判断哪一种边长更容易出现,那么就应该给予它们相同的概率,也就是说1~ 3之间每一种长度都是等可能的。
1~2包含了一半的可能长度:

所以,正方形边长在1~ 2尺之间的概率为1/2。
5 古典派的缺点
古典派的缺陷也是非常明显的:
(1)古典派的概率定义,“未知的概率都是等概率”,有循环定义的嫌疑。
(2)不充分理由原则没办法处理非等概率的情况,假如被告知硬币两面是非等概率的,但是不知道是哪一面,那么应该怎么办?(拉普拉斯提出还是应该按照等概率来处理)
(3)还容易产生矛盾,比如刚才练习题中提到的原木加工厂,它会把木头切成不同的木方,木方的截面都是正方形,边长会在1~3尺之间随机浮动:

那么根据不充分理由原则,正方形边长在1~ 2尺之间的概率为1/2。
刚才的问题还可以转为面积来解答,1~3尺边长的正方形面积为1~9平方尺,1~ 2尺边长的正方形面积为1~4平方尺:

同样,根据不充分理由原则,1~9平方尺之间的正方面面积是等可能的,那么正方形面积在1~4平方尺之间的概率为3/8 :

选择对“长度”还是对“面积”运用不充分理由原则,同一个问题会得到了不同的概率:

上述问题是伯特利悖论(Bertrand's paradox)简化版,由伯特兰在1899年出版的《概率论》中提出:

约瑟·路易·弗朗索瓦·伯特兰(1822-1900)
伯特兰悖论先说在这里,之后会有专门介绍古典派概率的章节,到时再来解决这个悖论。
6 主观派
最后介绍下主观派,主观派认为概率是信念强度(degree of belief)。
比如说,我个人相信20年后人类从网络时代进入人工智能时代的概率为70%:

上面说的概率也就是主观概率,是个人对这个命题的信念强度,换句话说我觉得还是很有可能实现的。
虽说是主观概率,其实也有客观的部分,比如刚才对人工智能的判断,就是基于AI的基础设置发展、计算速度的提高等事实。
主观概率更贴近人的思考方式,比如我们在作科学研究时,会先给出一个猜想,这就是给出了一个主观概率。
所以在人工智能时代,因为要模仿人的行为,主观概率越来越受到重视:

当然主观派缺陷也很明显,这也是被大家接受困难的原因:
说到科学,大家都认为应该是客观的,但是偏偏主观概率不客观,充满了个人偏见
因为主观,大家很难对某个主观概率达成共识
7 小结
三个流派大概有以下的区别:

概率三个流派的区别
这三个流派并非泾渭分明、互不相容,反而在发展中犬牙交错。比如要判断火山的喷发概率,就需要总结过往数据(频率派),再加入主观知识(主观派)。
为什么概率的定义不明确?可能因为概率本身研究的就是“不明确”。
马同学图解系列之《概率论与数理统计》,覆盖浙江大学《概率与数理统计》前八章(考研范围),欢迎同学加入学习(微信公众号:马同学高等数学)