基础统计学(6)概率分布

2020-03-18  本文已影响0人  Best_Scenery

Probability distributions

4.01 Random variables and probability distributions

随机变量和概率分布

随机变量指随机现象中可能出现的数值结果的值,分

distribution_1.png

概率分布,表示每个随机值出现的概率

distrubition_2.png
4.02 Cumulative probability distributions

累积概率分布

累积概率是小于等于某个阀值的值的概率

累积概率指明了分位情况

distribution_3.png
4.03 The mean of a random variable

随机变量的平均数
Ux = E(x) = \sum[x_i*P(x_i)]

该公式表示,平均数=每个元素与它概率的乘积之和

以下公式也成立:
U_{a+bx} = a + bx
x_i为a+bx
U_{x+y}= U_x+ U_y

x和y不管是否互相依赖

4.04 Variance of a random variable

随机变量的方差

Var(x) =

连续型数据: \int(x-u)^2*f(x)dx

离散型数据: \sum(x_i-u)^2*P_i(x_i)

以下公式成立:
var(x+a) = var(x)

var(a*x) = a^2var(x)

var(x+y) = var(x) + var(y)

这里需要x,y没有关联性

4.05 Functional form of the normal distribution

正态分布的函数形式

正态分布,又叫高斯分布, 看下图:

distribution_5.png

累积正态分布如下图:

distribution_6.png

\mu是它的y轴(概率)0.5的位置, \sigma表示它斜坡陡峭程度(越大越陡)

正态分布的完整公式为:
f(x)=\frac{1}{\sigma\sqrt{2\pi}}e^{-0.5}(\frac{(x-\mu)}{\sigma})^2
这个公式不只用来表示概率分布,也可以用来描述某些物质的表现形式,比如蜂蜜流淌、交通等的扩散情况。。。

正态分布还有以下特点

distribution_7.png
4.06 The normal distribution: probability calculations

正态分布:概率计算

第一种方法可以根据将正态分布转换成累积正态分布图来获得某个值的累积概率

第二种方法可以根据下图正态分布的特性来计算

distribution_8.png
4.07 The standard normal distribution

标准正态分布

我们如何计算正态分布中的概率问题呢?

公式补充:

计算z-score : z_i=(x_i-\mu)/\sigma

计算x值: x_i=\mu+z_i\sigma

4.08 The binomial distribution

二项分布

二项分布是n独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率p。这样的单次成功/失败试验又称为伯努利试验。实际上,当n = 1时,二项分布就是伯努利分布

二项分布的公式如下:
p(x) = \frac {n!}{x!(n-x)!}P^x(1-P)^{n-1}

符合二项分布的条件

  1. 成功概率不会变化
  2. 每次实验之间是不相互依赖的

二项式分布的参数转换

\mu = g(p, n), \sigma = f(p,n)

u=np, \sigma=\sqrt{(np(1-p))}

二项式分布有三种形式,见下图

distribution_9.png
上一篇 下一篇

猜你喜欢

热点阅读