机器学习-算法理论

Uplift:Partial observation model

2020-11-06  本文已影响0人  shudaxu

场景:

数字营销,广告行业。在互联网领域,流量变现一直都是很多产品非常大的一个利润来源。因为很多传统领域(甚至一些转型的领域,如电商)在互联网环境下,一个重大的开支都是营销支出,这些支出中其中一个重要分支说到底,就是流量成本。


目标分析:

核心难点1:Partial Observation

核心难点2:无法完全无偏

理解到上述问题后,我们的任务就是对问题进行建模。那么现在其实有多种建模的思路:


建模思路:

conceptional 2x2 Matrix:[2] 先通过这个图,理解一下我们知道的,我们想知道的:


image.png

评估思路:

这里评估也因为partial observation,有一大难点,就是我们无法知道真正的uplift(用户在treatment与control两种状态下分别的ground truth我们只能观测到一种)。所以,我们的思路便是:以群体的视角来看待用户。,用在群体中的期望收益,来代替对个人的收益。(对于某一个人我们只能观测到T 或者C其中一种状态。而对于群体我们能通过随机策略,同时获得T与C组的观测结果,通过群体上的期望评估来代替个人)

Qini Curve

QINI = TR - [(CR*T)/C];QINI = (TR/T) - (CR/C)【这是归一化的后的百分比QINI】


qini curve

这个非常好理解x轴为人数,y轴为累积收益:

图中线段:

AUUC

变量假设参考论文[4]
我们可以用类似auc的方式计算:


image.png

Qini coefficient

类似地,也是参考qini curve:

image.png
这里NT,NC标示T组的人数,C组的人数。这里便是将其scale到同一个人数标准下。
RT(k)=kE(Y|t=T),即分为点数量每组期望数量转化数量

Refer:
[1]:Uplift Modeling with Multiple Treatments and General Response Types
[2]:https://www.kaggle.com/davinwijaya/uplift-modeling-qini-curve-with-python
[3]:The Class variable transformation (CVT) Model(Jaskowski und Jaroszewicz, 2012) and Lai´s Weighted Uplift Method (LWUM) (Kane, Lo und Zheng, 2014)
[4]:A Large Scale Benchmark for Uplift Modeling
https://zhuanlan.zhihu.com/p/100821498
https://blog.csdn.net/jxq0816/article/details/105100834/

上一篇下一篇

猜你喜欢

热点阅读