概率论与统计推断(二) ------ 随机变量及其分布

一.随机变量(实际上是函数)
概率论的目的:给定随机试验的数据生成过程,研究数据的性质, 如概率分布(下面的二/三/四)、数字特征(五)。
概率分布:所有的可能结果和它们发生的可能性。(样本空间+概率) 数字特征:由分布决定的随机变量某一方面的特征的常数,如数学期望和方差。
X : 输入样本空间的值,输出实值

两种随机变量 :

二.离散型随机变量X的分布律(离散型随机变量的概率分布)

0-1分布 : 可用来解决两类分布问题

二项分布 :
组合数C : 从n个不同元素中,任取m(m≤n)个元素并成一组,叫做从n个不同元素中取出m个元素的一个组合;从n个不同元素中取出m(m≤n)个元素的所有组合的个数,叫做从n个不同元素中取出m个元素的组合数。
在线性写法中被写作C(n,m)。
组合数的计算公式为

n 元集合 A 中不重复地抽取 m 个元素作成的一个组合实质上是 A 的一个 m 元子集和。如果给集 A 编序

成为一个序集,那么 A 中抽取 m 个元素的一个组合对应于数段

到序集 A 的一个确定的严格保序映射。组合数

的常用符号还有


举例 :


分布律无法表示非离散型随机变量的概率分布
三.分布函数(非离散型随机变量,离散型随机变量也可以用分布函数来表示)
实际应用中我们只关心非离散型随机变量在某个范围的概率。

下面案例就是用分布函数表示分布律 :
X的取值为-1,1,3,x>=3时是必然事件,所以概率肯定是1

案例二 :

四.连续型随机变量和概率密度函数
1.基础
求导是数学计算中的一个计算方法,它的定义就是,当自变量的增量趋于零时,因变量的增量与自变量的增量之商的极限。在一个函数存在导数时,称这个函数可导或者可微分。可导的函数一定连续。不连续的函数一定不可导。
2.定义


3.常见的概率密度函数
①.均匀分布

②.正态分布(高斯分布)
其概率密度函数为正态分布的期望值μ(miu)决定了其位置,其标准差σ(色伽马)决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。所有值都可导

③.拉普拉斯分布
在中心点不可导,比不上正态分布

五.数学期望与方差
1.数学期望(平均值)

绝对收敛 : 不等于正无穷也不等于负无穷(收敛 : 是指会聚于一点,向某一值靠近)


2.方差
求方差过程中首先取与数据期望的偏差,取平方是为了消除偏差负值的影响,从而防止偏差正负想消带来的影响,从而使得标准差完全反映偏差的幅度,开方是因为之前取了平方,因此开方将计算结果拉回到原来偏差幅度的量级

E(X) : 均值(是常数)


