van der Vaart渐进统计之半参:3. 切空间(Tang
2021-01-06 本文已影响0人
顾劝劝
引入Fisher information的推广版本的概念。我们知道在一个概率测度集合里估计参数,比这个率测度子集里估计参数要难。空间越大,信息越少。全模型的信息不会比子模型中信息最少的那个更多。我们管那个信息最少的子模型叫做“least favorable”或者“hardest” submodel。
我们先来考虑一个一维子模型们(大多数情况下考虑一维就足够了)。它包含了真实分布 P,而且在P处可导*。看一个这样的映射:
,t在0的非负邻域,映射的像在
,对于某个可测函数
有
我们称这个参数子模型是differentiable in quadratic mean at t=0,它的score function是
。这个映射跑遍所有的子模型,我们就能得到一族score function,叫做模型
在P处的tangent set,记成
。tangent set往往是一个线性空间,这样的话我们就把这个集合叫做tangent space,切空间。
子空间经常是这样构造的,对于每个x:
我们关心的其实是模型中的那个参数,而且关心那些可微的参数:
这个线性映射可以写成内积的形式,也可以写成可测函数(不唯一)的形式:
这个函数不唯一,但是我们可以找到一个候选的,包含在tangent set的linear span的闭包(closure)里。这个函数是唯一的,这边是大名鼎鼎的efficient influence function。别的influence function投影在这个tangent set的closed linear span上,就是它。
* 如果存在一个可测函数向量,使得
,那么模型
就是differentiable in quadratic mean at
。