(概率论基础1)一维随机变量

2019-04-27  本文已影响0人  To_QT

随机变量概念

随机变量与确定性变量的区别:

随机变量的分类:

离散型随机变量的分布

概率函数与分布函数定义

对于一个随机变量,人们更关注于取一个值的概率是多少,因此引入了概率函数
定义:关于X的概率函数,有
\begin{align} p_i=P(X = a_i), i=1,2,... \tag{2.1} \end{align}

某一事件概率的集合称为分布函数,定义:设X为随机变量,则函数
\begin{align} P(X \leq x) = F(x), -\infty<x<\infty \tag {2.2} \end{align}
称为X分布函数

分布函数的性质

几种常见的分布

1、二项分布,记为X \sim F

检查某厂产品次品率p的大小,从中抽取若干件,检查次品数量X的大小。
\begin{align} p_i = b(i;n, p) = \binom{n}{i} (p)^{i}(1-p)^{n-i} \tag{3.1} \end{align}

其中二项分布需要满足两个要求:
  1.各次试验中的条件是稳定的,保证p不会发生改变。
  2.各个事件相互独立。

2、泊松分布,记为X \sim P(\lambda)

\begin{align} P(X=k)=\frac {\lambda ^{k}\cdot e^{-\lambda}}{k!} \tag{3.2} \end{align}

泊松分布与二项分布之间的关系
设所观察时间段为[0, 1),取一个很大的n,则有l_1=[0,\frac{1}{n}), l_2=[\frac{1}{n}, \frac{2}{n}),..., l_n=[\frac{n-1}{n}, 1)。假设:

  1. 在每段l_i内,事件发生的概率与时间长度成正比,取p=\frac{\lambda}{n}。那么,在n很大的情况下,这么短时间内不可能同时发生两次事件。因此,在l_i内不发生的概率为1-\frac{1}{n}
  2. l_1, l_2, ..., l_n相互独立。
    则有,在[0, 1)内发生k件事件的概率为:

\begin{align} p_k \approx b(k;n, \frac{\lambda}{n}) = \binom{n}{k}(\frac{\lambda}{n})^{k}(1-\frac{\lambda}{n})^{n-k} \tag{3.3} \end{align}
n \to \infty时:

    \binom{n}{k}(\frac{1}{n})^{k} \to \frac{1}{k!}

    (1-\frac{\lambda}{n})^{n-k} \to e^{-\lambda}

3、超几何分布

总共有N件商品,里面有M件次品,问取出得n件商品中,含有m件次品的概率。
\begin{align} P(X=m) =\frac{\binom{M}{m} \binom{N-M}{n-m}}{\binom{N}{n}} \tag{3.4} \end{align}

4、负二项分布

检查某厂产品次品率p的大小,从中一件一件抽取,直到抽中r件次品为止。X记为已经检测合格的产品数量。
\begin{align} p_i = b(r-1; i+r-1, p) = \binom{i+r-1} {r-1}(p)^{r-1}(1-p)^{i} p \tag{3.5} \end{align}
与二项分布的区别:二项分布总是定下总的抽检数n,把废品个数X作为变量,而负二项分布则是定下次品数r,把合格数量定为X

连续型随机变量的分布

密度函数定义及解释

定义:设连续型随机变量X的分布函数为F(X),则其导数f(x)={F}'(x)称为X概率密度函数
解释:由导数的物理意义可知,事件\{x<X \leq x+h\}的概率应为F(x+h)-F(x)。所以(F(x+h)-F(x))/h可以理解为在单位点x附近h这么长的区间内,单位长所占的的概率。即总质量为1的金属棒,概率密度相当于杆上的各点的质量密度。

特点:

  1. \int_{-\infty}^{\infty}f(x)dx=1
  2. f(x)\geqslant 0
  3. 对于任何常数 a<b,都有P(a<x<b)=F(b)-F(a) = \int_{a}^{b}f(x)dx
1、正态分布,记为X \sim N(\mu, \sigma^{2})

如果一个随机变量具有概率密度函数
\begin{align} f(x) = \frac{1}{\sqrt{2\pi }\cdot \sigma}\cdot e^{\frac{-(x-\mu)^2}{2\sigma^2}} \tag{4.1} \end{align}

正态分布概率函数图像

正态分布的性质:

2、指数分布

指数分布的概率函数为
\begin{align} f(x)= \left\{\begin{matrix} \lambda e^{-\lambda x}, x>0 \\ 0,x\leqslant 0 \end{matrix}\right. \tag{4.2} \end{align}
指数函数的分布函数为:
\begin{align} F(x)= \left\{\begin{matrix} 1 - e^{-\lambda x}, x>0 \\ 0,x\leqslant 0 \end{matrix}\right. \tag {4.3} \end{align}
在指数函数中,常用于寿命分布,\lambda的意义为,元件在时刻 x尚能工作的情况下,其失效率为某个常数 \lambda>0,与x无关。另外,\lambda^{-1}就是平均寿命。
\begin{align} \frac{P(x\leqslant X \leqslant x+h | X>x)} {h} = \lambda\tag{4.4} \end{align}

3、均匀分布,记为X \sim R(a, b)

均匀分布的概率密度函数为:
\begin{align} f(x)= \left\{\begin{matrix} \frac{1}{b-a}, a \leqslant x \leqslant b \\ 0, 其他 \end{matrix}\right. \tag{4.5} \end{align}

均匀分布的分布函数为:
\begin{align} F(x)= \left\{\begin{matrix} 0, x \leqslant a \\ \frac{x-a} {b-a} , a < x <b \\ 1, b \leqslant x \end{matrix}\right. \tag{4.6} \end{align}

f(x)与F(x)图像

随机变量的函数分布

随机变量Y是随机变量X的函数,且有Y=g(X).

  1. 在随机变量函数Y=g(X)中,区分清楚X, x各自代表的含义是什么。
  2. 在处理类似于 Y=|X|这类函数时,考虑好X分布函数中和事件的关系。
  3. y的范围问题:
    3.1 Y=g(X)时需要考虑
    3.2 在完成计算后需要再次检验。

参考文献

上一篇下一篇

猜你喜欢

热点阅读