Columbia 可靠统计推断 第二课·bounded diff
2020-12-27 本文已影响0人
顾劝劝
课件来自Namkoong讲义
我们要证明ERM估计的参数能够达到总体分布下损失期望的近似最优。
也就是uniform concentration guarantees:
定义1(轻尾)
A RV is
-sub-Gaussian if
。
其实不等式右边就是标准正态的矩母函数。等于说这个分布的尾巴至少和正态分布一样轻。
这样用马尔可夫不等式我们就有
时,上式
。
同样地,对于也有
- 例子1:
随机符号(Rademacher)是1-sub-Gaussian
- 例子2: 在a和b的闭区间内的零均值随机变量是
-sub-Gaussian
Bounded differences对证明下面的定理非常有用
定理1
如果g有这样的性质:
(一个维度不会改变整体函数值太多)
对于独立的随机变量来说,
(Hoeffding bound的推广)
定义2 (鞅差)
是一个鞅序列,w.r.t. 随机变量
。
如果M是可测的,
,
,
那么叫做martingale difference sequence w.r.t
,而且
。
引理1
如果是martingale difference sequence w.r.t
,
那么存在,使得
,那么
是
-sub-Gaussian的。