统计学2.1-离散随机变量
2019-11-06 本文已影响0人
赵阳_c149
离散随机变量定义
即分布函数的值域是离散的:
F(x)=P{X<=x}
P(X=ai)=pi,用表格表示出来
1)Pi>=0
2)∑Pi为1
概率质量函数(probability mass function)
是离散随机变量在各特定取值上的概率。概率质量函数和概率密度函数的不同之处在于:概率质量函数是对离散随机变量定义的,本身代表该值的概率;概率密度函数是对连续随机变量定义的,本身不是概率,只有对连续随机变量的概率密度函数在某区间内进行积分后才是概率。
常用离散随机变量:
-
二项分布 (n次Bernoulli)
bi_standard_var.png
均值(mean) E(X) = n*p
换句话说,正常硬币正面朝上的概率是p=0.5。如果你投掷硬币20次,均值将为20 * 0.5=10,即预计有10次正面朝上。
方差:σ2 = np(1-p)
换句话说,标准偏差是方差的平方根。
概率质量函数【1】:
bi_f.png
二项分布中你看到最流行的地方之一是逻辑回归。【2】 -
泊松分布
泊松分布是二项分布的一种极限形式。对于二项分布,当np>20,且p<0.05的时候,近似服从泊松分布。泊松分布又被称为罕有事件分布。
po_f.png
泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生次数。泊松分布适合于描述单位时间内随机事件发生的次数。
泊松分布的期望和方差均为λ。
Binomial_distribution
泊松分布
【1】概率质量函数
【2】逻辑回归