时间序列预测&归因分析 2021-12-10

2021-12-17  本文已影响0人  WarriosBlue

https://cloud.tencent.com/developer/article/1666552

https://cloud.tencent.com/developer/article/1480301?from=article.detail.1666552

https://cloud.tencent.com/developer/article/1631574?from=article.detail.1666552

JS散度
https://zhuanlan.zhihu.com/p/74075915

https://zhuanlan.zhihu.com/p/35709485

不确定性函数 f(x) = -log p(x) ,概率越小,不确定性越大
交叉墒:用来优化不确定性的,预测 和 实际分布之间的不确定性

【Adtributor 算法】
https://blog.csdn.net/Eaton18/article/details/103797563
https://cloud.tencent.com/developer/article/1644348

核心思路:对每个维度,找出真实值和预测值存在巨大差异的几个因素,如果这些因素累加在一其的波动占整体波动很大比例,则认为这几个因素就是造成这次收入波动的根本因素

Adtributor缺点及局限
(1)上述是针对基本类型的KPI的计算公式(例如PV、交易量),对于派生类型的KPI(多个基本类型KPI计算得到,例如成功率)就不太适用了

(2)将根因限定在一维的假设不太符合我们的实际场景,同时用解释性和惊奇性的大小来衡量根因也不完全合理。因为其没有考虑到维度之间的相互影响以及「外部根因」的可能

(3)Adtributor的根因分析严重依赖于整体KPI的变化情况,对于整体变化不大,但是内部波动较为剧烈的数据表现不好

相关论文
Adtributor: Revenue Debugging in Advertising Systems

Recursive Adtributor

iDice: Problem Identification for Emerging Issues
翻译
主要贡献是寻找effective combination

HotSpot: Anomaly Localization for Additive KPIs with Multi-Dimensional Attributes
翻译

Squeeze:Generic and Robust Localization of Multi-Dimensional Root Causes

Bayesian structure learning algorithm

知乎精答
https://www.zhihu.com/question/331456480/answer/806871325

上一篇 下一篇

猜你喜欢

热点阅读