经验分布函数简介
2021-06-15 本文已影响0人
Boye0212
1 概念
如果我们想知道某个随机变量的分布,这在一般情况下当然是无法准确知道的,但如果我们手上有它的一些独立同分布的样本,可不可以利用这些样本?一个很简单的办法就是,把这些样本的“频率”近似为随机变量的“概率”。
经验分布函数(empirical distribution function):给每个点的概率质量,得到CDF:
2 性质
经验分布函数,有什么性质?它可以很好地近似真实的分布函数吗?我们给出如下几个定理。
定理:对于任意给定的,有
- ;
- ;
- ;
- 。
Glivenko-Cantelli定理:,那么
更准确地说,上式其实是几乎必然收敛的。
Dvoretzky-Kiefer-Wolfowitz (DKW) Inequity:,那么,有
利用DKW不等式,可以构造出的非参数的置信带:定义,,其中,那么有
3 应用
经验分布函数有什么用?它可以用来计算一些statistical functional(统计泛函)。
假设要计算的statistical functional为,那么,可以利用经验分布函数,代替未知的分布函数,计算出的plug-in estimator(嵌入式估计量):。
如果存在某个使得,那么就称为linear functional(线性泛函),这是因为这样的必定满足。对于这样的linear functional ,它的plug-in estimator可以写为: