通俗理解:概率分布函数、概率密度函数
2019-11-23 本文已影响0人
视学算法
这篇文章通俗地解释了概率论的两个基石函数:概率分布函数、概率密度函数,建议不熟悉的同学,认真阅读。
1 先从离散型随机变量和连续性随机变量说起
对于如何分辨离散型随机变量和连续性随机变量,在贾俊平老师的《统计学》教材中,给出了这样的区分: 如果随机变量的值都可以逐个列举出来,则为离散型随机变量。如果随机变量X的取值无法逐个列举则为连续型变量。 进一步解释,离散型随机变量是指其数值只能用自然数或整数单位计算的则为离散变量。例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得。反之,在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。例如,生产零件的规格尺寸,人体测量的身高,体重,胸围等为连续变量,其数值只能用测量或计量的方法取得。 形象点来解释:: 画一幅画,左边是梯子,右边是斜坡。 像梯子一样能说出有多少层的,可描述的,是离散型随机变量; 像斜坡一样不能说出有多少层阶梯,不可描述的,是连续性随机变量。 需要注意的是,实际操作中梯子的阶高可能很小,看起来很像斜坡,需要放大看。2 离散型随机变量的概率函数,概率分布和分布函数
概率分布函数和概率密度函数之前,我们先来看看概率函数和概率分布是咋回事。为什么我们花这么大的力气去研究这个概念。因为它实在太重要了,为什么呢?在这里,直接引用陈希孺老师在他所著的《概率论与数理统计》这本书中说的: 研究一个随机变量,不只是要看它能取哪些值,更重要的是它取各种值的概率如何! 这句是本文的核心内容,本文的所有概念,包括概率密度,概率分布,概率函数,都是在描述概率! 2.1 概率函数和概率分布 2.1.1 概率函数 概率函数,就是用函数的形式来表达概率。 pi=P(X=ai)(i=1,2,3,4,5,6) 在这个函数里,自变量(X)是随机变量的取值,因变量(pi)是取值的概率。它就代表了每个取值的概率,所以顺理成章的它就叫做了X的概率函数。从公式上来看,概率函数一次只能表示一个取值的概率。比如P(X=1)=1/6,这代表用概率函数的形式来表示,当随机变量取值为1的概率为1/6,一次只能代表一个随机变量的取值。 2.1.1 概率分布 接下来讲概率分布,顾名思义就是概率的分布,这个概率分布还是讲概率的。我认为在理解这个概念时,关键不在于“概率”两个字,而在于“分布”这两个字。为了理解“分布”这个词,我们来看一张图。
![](https://img.haomeiwen.com/i14546045/886b5380e92eafc6.png)
![](https://img.haomeiwen.com/i14546045/7e57a130d38bda54.png)
2.2 分布函数
说完概率分布,就该说说分布函数了。这个分布函数是个简化版的东西!全名应该叫概率分布函数。 看看下图中的分布律,这里的分布律明明就是我们刚刚讲的“概率函数”,完全就是一个东西。但是我知道很多教材就是叫分布律的。![](https://img.haomeiwen.com/i14546045/19147c5339b4fb36.png)
3 连续型随机变量的概率函数和分布函数
连续型随机变量的“概率函数”换了一个名字,叫做“概率密度函数”。 为啥要这么叫呢?我们还是借用大师的话来告诉你,在陈希孺老师所著的《概率论与数理统计》这本书中,![](https://img.haomeiwen.com/i14546045/c0fb6c4cd5c508ec.png)
![](https://img.haomeiwen.com/i14546045/85cdf7c34b57150d.png)
![](https://img.haomeiwen.com/i14546045/b26400d70de4d487.png)