机器学习-算法理论

Debiasing:Formulation & Summariz

2021-07-01  本文已影响0人  shudaxu

Formulation:

Bias的类型其实有很多,其中有的是非常明确的,而有的问题并非well defined。我们这里讨论如何将各种Bias都准确地形式化出来,构建一个体系化的框架来帮助大家思考。我们在Confounding Bias & Selection Bias中已经讨论了两种Bias,这里进行一些总结,以及更广泛的讨论。

Method:

思考

关于何时应当Debiasing?其实,更多时候,越是底层的系统,可能越需要Debiasing,而上层的系统,可能反而任务没那么重。比如我们更应该关注粗排,召回拉链排序,特征统计等问题上的Debias【比如Popularity Bias,Position Bias等】,而精排本身是为了精准地给出即时预测,某些Bias反而可能不是Bias了。

Refer
[1]
a、s-Recovery 的条件,在不进行先验的分布参数化的情况下,我们能否从biased的数据中获取无偏概率:Recovering from Selection Bias in Causal and Statistical Inference
b、在Selection Bias的情况下去除Confounding bias:上述论文的以下章节:Recoverability of Causal Effects

[2] Popularity Bias
Managing Popularity Bias in Recommender Systems
with Personalized Re-ranking

[3]详细见:Sample selection bias correction theory
Sec4还有 关于weighting对acc的影响,以及其error如何估计

Elkan 2001; Zadrozny 2004; Smith and Elkan
2007; Storkey 2009; Hein 2009; Cortes et al. 2008)

[4]工业界一些Debias的研究
https://zhuanlan.zhihu.com/p/342905546

[5]这里是个矛盾点:
Sample Selection Bias Correction Theory 假设了sy无关(因为unselected data没有label y,所以如果与y相关就没法估计了,其实大部分情况下,很可能也确实无关)。但是在Recovering from Selection Bias in Causal and Statistical Inference中的结论相反。后者的结论是,如果sy独立,则根本不需要debiasing。
这两者看似矛盾,其实不是,因为根本原因是:有未观测变量U的存在。真正单纯的S \leftarrow X \rightarrow Y在真实环境中很难存在。(比如在一个推荐系统中的CTR模型,U是用户此刻的心情,影响了其下滑的概率,从而影响了S,当然,心情也会影响其点击行为Y
例如真实G_sS \leftarrow X \rightarrow YS \leftarrow U \rightarrow Y,由于U的存在,Selection变量S的影响会被U pickup,再传递给Y,即,given X的情况下YS不独立Y \not\perp S | X,所以P(Y| X, S=1) \neq P(Y|X),即直接在S=1的sample上估计P(Y| X, S=1)跟真实概率是不同的,是是有偏的。
另外,由于Confounder U的存在,其实P(S|X,Y) \neq P(S|X),即这里也是有偏的,所以上述方法,虽然名义上消除了Selection Bias,但是实际上在w_i的计算上,引入了新的bias。但是由于P(S|X)可以通过population level的数据进行估计,所以比Selection 本身带来的bias要小?
但是我们通过X估计S的时候虽然没有观测到U,但是由于我们有Population Level的数据,起码P(S|X)是无偏的,,但是我们用IPS来去偏的方法是可行(无偏)的。
其他讨论见:
a、Stratification and Weighting Via the Propensity Score in Estimation of Causal Treatment Effects: A Comparative Study
b、Estimation of Regression Coefficients When Some Regressors Are Not Always Observed

[6]prediction与inference的区别
关于Inference and prediction的差异:
https://stats.stackexchange.com/questions/457410/inference-prediction-model-fit第二个回答。以及
Inference更在意解释性,缩减bias。Prediction更在意预估能力(predictive power),同时缩减bias and variance。To Explain or to Predict?(Galit Shmueli)
Inference通常用goodness of fit来评估。而Prediction需要holdout test set来评估。
TODO仅此似乎也不能完全解释上述结论的矛盾性

上一篇 下一篇

猜你喜欢

热点阅读