第六章:数理统计中常用的3个分布

2019-12-06  本文已影响0人  cheerss

1. 基本概念

均值和方差

分布均值、方差是\mu\sigma。这两个是定值,不随着采样的变化而变化。

样本均值、样本方差是\bar{X} S^2。这两个值是根据样本计算出来的,采样不同,自然值也不同。其中\bar{X} = \frac{1}{n}\sum_{i=1}^{n}x_iS^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{X})^2

在数理统计中,\bar{X}\mu的无偏估计,而S^2\sigma的无偏估计。

K阶距

B_K = \frac{1}{n}\sum_{i=1}^n(x_i-\bar{X})^k

A_K = \frac{1}{n}\sum_{i=1}^nx^k_i

其中A_k是k阶原点距,B_k是k阶中心距。二阶中心距也是方差的一个估计,但是是有偏估计。

下面开始说重点:\chi^2分布、t分布、F分布是数理统计中最常用、最重要、最核心的3个分布,也是区间估计、假设检验、方差分析等的基础。这三个分布的概率密度和分布函数是怎么推导出来的我不知道,但是推导起来一定不轻松,对于大部分使用者来说也不必记忆和学会推导这些内容,只需要记住其中一些重要的结论即可,例如:三种分布是怎么来的,它们的的均值、方差是多少,函数图像大概长什么样子。

2. 卡方分布

卡方分布(\chi ^2分布)是相互独立的、0-1正态分布的平方和,即:

\chi_n^2 = \sum_{i=1}^nx^2_n,其中x_i \sim N(0, 1)

此时,我们说它是自由度为n的卡方分布。

我觉得这个东西不用记 这个图有点神奇

重要性质

1. E(\chi^2) = n, D(\chi^2) = 2n

2. 卡方分布满足可加性,即两个相互独立的卡方分布的和依然是卡方分布(注意,必须相互独立)

3. t分布

t分布是一个0-1正态分布除以一个卡方分布开根号,即

T = \frac{X}{\sqrt{Y/n}},其中,X \sim N(0, 1), Y \sim \chi^2(n), 记为T \sim t(n)

我觉得这个也不用记 t分布的概率密度函数

4. F分布

F分布是两个卡方分布的商,即:

F = \frac{X/n_1}{Y/n_2},其中X \sim \chi^2(n_1), Y \sim \chi^2(n_2)

n1和n2称为第一和第二自由度

重要性质

1. F分布的倒数的第一第二自由度刚好相反的F分布

F分布的概率密度函数 F分布的概率密度函数

数理统计中的一些常识

X_1, X_2, X_3...X_n相互独立的服从N(\mu, \sigma^2)的随机变量,其中\bar{X} 和 S^2分别为样本的均值和方差。则:

1. \frac{(n-1)S^2}{\sigma^2} = \frac{\sum_{i=1}^{n}(X_i - \bar{X})^2}{\sigma^2} \sim \chi^2(n-1)

2. \frac{\sum_{i=1}^{n}(X_i - \mu)^2}{\sigma^2} \sim \chi^2(n)

3. \bar{X} 与S^2相互独立

4. \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1)

5. D(\bar{X}) = \frac{\sigma^2}{n}, E(S^2) = \sigma^2,D(S^2) = \frac{2\sigma^4}{n-1}

6. Cov(X_1, \bar{X}) = \frac{\sigma^2}{n}, \rho_{X_1, \bar{X}} = \frac{1}{\sqrt{n}}

X_1, X_2, X_3...X_n服从N(\mu_1, \sigma^2_1)Y_1, Y_2, \cdots, Y_n服从N(\mu_2, \sigma^2_2),所有样本相互独立且样本方差分别为S_1^2S^2_2。则:

1. \frac{S_1^2 / \sigma_1^2}{S_2^2 / \sigma_3^2} \sim F(n_1-1, n_2-2)

2. \frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{\sqrt{\frac{\sigma_1}{n_1}+\frac{\sigma_2}{n_2}}} \sim N(0, 1)

3. 当\sigma^2 = \sigma_1^2 = \sigma_2^2\frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{S_w\sqrt{1/n_1 + 1/n_2}} \sim t(n_1 + n_2 - 2), 其中S_w = \sqrt{\frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2}}

上一篇 下一篇

猜你喜欢

热点阅读