概率论与数理统计 第六章 统计量和抽样分布
课前导读
当随机变量相互独立时,联合分布律可由随机变量的分布律乘积表示。
![](https://img.haomeiwen.com/i16722260/b90732be18867f76.png)
推广到n维:
![](https://img.haomeiwen.com/i16722260/292215cc16eac52e.png)
从本章起讲述统计的基本知识。
统计学研究如何用有效方法收集、整理和分析带有随机性影响的数据,对研究的问题作出推断和预测,为采取某种决策提供依据和建议。
![](https://img.haomeiwen.com/i16722260/0fc66ba7a21a5369.png)
第一节 总体与样本
一、总体
研究对象的全体称为总体
构成总体的每个成员称为个体
总体数量指标就是服从一个分布的随机变量,不妨用大写字母表示总体,那么总体就是具有未知分布函数
的一个随机变量。
![](https://img.haomeiwen.com/i16722260/1823e4c612450c7a.png)
按照总体中所包含个体数量的不同,总体可分为有限总体和无限总体。本书中只讨论无限总体的情况。
二、样本
在总体中抽取样本的过程称之为抽样,抽取规则称之为抽样方案。
简单随机抽样表示对总体的每一次抽样,总体中的所有个体都有相同的被选概率,用这种抽样方案得到的样本称为简单随机样本。为了体现随机性,用大写字母来表示,其中n为样本的大小,称为样本容量。
简单随机样本具有下列两个特性:
![](https://img.haomeiwen.com/i16722260/4953df3c68edcb59.png)
![](https://img.haomeiwen.com/i16722260/9ba44df5007f4275.png)
样本观测值:
![](https://img.haomeiwen.com/i16722260/7d818dbe63e19639.png)
第二节 统计量
数理统计的基本任务之一是利用样本提供的信息来对总体分布中未知的量进行推断,简单来说,就是由样本推断总体。但样本常表现为一组数据,难以直接利用,为此人们通常把数据加工为若干个数字特征,称为统计量。
统计量的定义:
![](https://img.haomeiwen.com/i16722260/cbe0a3adce4e49a0.png)
构造统计量的主要目的是去估计总体分布中的未知参数。常用统计量包括:样本均值、样本方差、样本矩和次序统计量等。
一、样本均值和样本方差
样本均值:
![](https://img.haomeiwen.com/i16722260/0c738a10f54e0367.png)
样本方差: 注意样本方差分母为
![](https://img.haomeiwen.com/i16722260/4450e9c7e6987c03.png)
它们的观测值分别为:
![](https://img.haomeiwen.com/i16722260/58ea5841df74d7f8.png)
原点矩和中心距:
![](https://img.haomeiwen.com/i16722260/a6a0bd56e3b63f32.png)
常用统计量的性质:
![](https://img.haomeiwen.com/i16722260/20fb283cd48ce91b.png)
![](https://img.haomeiwen.com/i16722260/a3fce5a321bafec1.png)
![](https://img.haomeiwen.com/i16722260/b7c76a2636b84748.png)
![](https://img.haomeiwen.com/i16722260/757666496c92831c.png)
二、次序统计量
次序统计量的定义:
![](https://img.haomeiwen.com/i16722260/1eb32e31d47f1988.png)
![](https://img.haomeiwen.com/i16722260/83c0a70dcb5651bb.png)
第三节 三大分布
分布、t分布、P分布都是从正态总体中衍生出来的。之前介绍的几种常用的统计量的分布在正态总体假定下都与这三大分布有关。
一、
分布
定义:
![](https://img.haomeiwen.com/i16722260/317a23470309ca89.png)
![](https://img.haomeiwen.com/i16722260/e0716f4de5e7f7da.png)
分布具有如下性质:
![](https://img.haomeiwen.com/i16722260/58675b8f76d84dab.png)
分布具有可加性
![](https://img.haomeiwen.com/i16722260/8833f411bbbfb86e.png)
![](https://img.haomeiwen.com/i16722260/2983ede942b7e866.png)
二、t分布
t分布的定义:,
,
服从自由度为n的t分布。(又称为学生氏分布)
![](https://img.haomeiwen.com/i16722260/0b1b56f409b62a0f.png)
当n充分大时,t(n)分布近似于N(0,1)分布。
![](https://img.haomeiwen.com/i16722260/188c1e65d5dc32a9.png)
![](https://img.haomeiwen.com/i16722260/83d7aeb8f14b78f7.png)
在实际中,当n>45时,对于常用的值,就用标准正态分布的分位数近似。
![](https://img.haomeiwen.com/i16722260/541d2445539fa8c4.png)
三、F分布
设随机变量X与Y相互独立,,则称
服从自由度为(m,n)的分布,记为
.
m为第一自由度,n为第二自由度。
![](https://img.haomeiwen.com/i16722260/944fe94a2c441d60.png)
![](https://img.haomeiwen.com/i16722260/a378bc3b0ec29f86.png)
![](https://img.haomeiwen.com/i16722260/608da044b40ed28f.png)
即F分布的α分位数和(1-α)分位数互为倒数。
![](https://img.haomeiwen.com/i16722260/2ee6decf2c9f83f4.png)
第四节 正态总体的抽样分布
抽样分布,即为统计量的分布。
![](https://img.haomeiwen.com/i16722260/dc7f560046467afd.png)
定理1:这个定理是正态总体中最基本的一个定理,后面定理2和定理3都是该定理与分布、t分布和F分布的应用。
![](https://img.haomeiwen.com/i16722260/d1be493869c769f4.png)
定理2:
![](https://img.haomeiwen.com/i16722260/546694944a1e04e3.png)
针对两个相互独立的正态总体有以下的定理:
![](https://img.haomeiwen.com/i16722260/b225fefd64c9cd64.png)
拓展阅读
统计学可以分为描述性统计学和推断性统计学两大类。
描述性统计学:将原始的数据资料加工成有用的图标。
但实际中往往只能得到总体中的一小部分,即样本数据,这就需要通过这些样本的有限不确定信息来确定有关总体的信息。
统计学的理论基础就是数理统计,是数学的一个分支,由一系列的定理及其证明组成。为了适用于不同专业领域的研究者,将统计理论简化与不同专业领域结合,就产生了相应的专业统计学,如生物统计学、医学统计学、经济统计学等。
学生氏分布的由来:
![](https://img.haomeiwen.com/i16722260/95842d9f7d7fd01e.png)