机器学习-算法理论

关于工业界variance的简单定性数值分析

2021-12-08  本文已影响0人  shudaxu

Variance估计的难处

再次回顾一下Bengio 对当代DNN的理解:
Machine learning is essentially a form of applied statistics with increased emphasis on the use of computers to statistically estimate complicated functions and a decreased emphasis on proving confidence intervals around these functions.
当今工业界更注重模型对大规模数据,复杂函数的拟合能力,而(不得不)忽视其估计的区间。
其实传统的统计模型,对区间的估计一直是非常重视的,但是由于通常在工业界,数据量非常巨大,参数维度也很高,因此直接计算估计参数的Variance很困难,而且由于DNN模型收敛性的理论并不是很健壮(也没有解析解),所以这些在传统统计模型得到的bound并不一定能在工业界模型有那么优秀的表现。

下位替代

综上,所以我们在这里使用近似的方法来获得variance大小一些定性的分析。
以下分析参考了OLS的variance lower bound:(注意其理论lower bound其实有较多正态性假设,所以对特定场景需要谨慎细致地进行判断)

上一篇下一篇

猜你喜欢

热点阅读