统计学第四周——概率分布
本周是统计学学习小组的第四周习内容如下:1、基本概念:随机变量、古典概率、条件概率、离散变量、连续变量、期望值、【大数定律】;2、离散变量概率分布:二项分布、伯努利分布、泊松分布 ;3、分布的形状:均匀分布、正态分布、指数分布。
1.整体逻辑
2.离散型随机变量的概率分布
设有一离散型随机变量X,可能取值x1,x2,...xn,其相应的概率为p1,p2....pn,即P(X=xi)=pi(i=1,2.....,n),其中被P(X=xi)=pi是X的概率函数。p1+p2+...+pn=1.
0-1分布:随机变量只能取0和1两个值,它的概率分布为P(X=1)=p,P(X=0)=1-p 。或P(x)=p^x*q^(1-x),x=0或1。式中,p,q>0为常量,p+q=1,则称X服从0-1分布。
均匀分布:每个X的取值的概率相同。
3.期望值、方差与标准差
3.1 期望值:E(X)=x1*p1+x2*p2+x3*p3...+xn*pn
3.2 方差:随机变量的方差可以反映随机变量取值的离散程度,随机变量的方差的定义为每一个随机变量取值与期望值的离差平方之期望值。方差就是[X-E(X)]^2的数学期望。D(X)=E(X^2)-E(X)^2。X取值集中,则方差较小;X取值分散,则方差较大;方差为0,则意味随机变量的取值集中于期望值E(X),随机变量以概率1取值于E(X)。标准差=方差^(1/2)
3.3 离散系数:可用来比较不同期望值的总体之间的离中趋势。计算公式=标准差/期望
4.二项分布和泊松分布
4.1 二项分布:(1)有n个相同试验(2)每次试验结果只有两个即0和1,且每次出现0或1的概率相同(即服从0-1分布)(3)试验是相互独立的。
期望为np,方差为npq
4.2 泊松分布:用来描述在一定时间范围内或指定的面积或体积之内某一件事出现的次数的分布。
5.连续型随机变量的概率分布
5.1概率分布与分布函数-概率密度函数满足以下几点:
5.2正态分布
(1)f(x)>=0
(2)μ是正态分布的位置参数,描述正态分布的集中趋势位置。概率规律为取与μ邻近的值的概率大,而取离μ越远的值的概率越小。正态分布以X=μ为对称轴,左右完全对称。正态分布的期望、平均数、中位数、众数相同,均等于μ。
(3)σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。
(4)x趋近于无穷时,曲线以x轴为渐近线。
当μ=0,σ=1时正态分布为标准正态分布。