策略Infrastructure
何谓好的 Infrastructure
好的infra意味着:
“无论在这些点上用多么山寨雷人的方法去做,只要tech driver的解释能力足够强,那么结果就能得到保证,用机制设计的术语说“social goal will be Nash implement” ”[1]
- 1、 核心算法(算法的开放性,可持续优化,演进)
- 2 、tech driver(来自可靠数据,“对算法本身”解释力足够强,且能够与最终目标(拆解的业务目标)契合来指示优化方向)
关于ML体系:
现代的ML体系(TF,pyTorch)本身就是个很好的infra,它具有很好的开放性。
1、核心算法:机器学习算法本身有很强的开放性,容纳任意的目标,特征形式,且能拟合各种复杂目标函数形式。同时,通过特征的优化,模型结构,超参,训练过程的优化,能不断迭代。
2、tech driver:就譬如排序模型中的AUC等指标。虽然不能直接指示最终KPI指标,但是能解释模型的排序能力,在单纯的排序任务中,就有足够强的解释力。在广告等场景,或者多目标排序时,可能还需要CTCVR的AUC,OE等等指标。
对ML本质的定义(Essence of ML):
Tom Mitchell:
A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.1
一种形式上的定义。
Yoshua Bengio:(w2v,attention...)(Hinton, LeCun)
Machine learning is essentially a form of applied statistics with increased emphasis on the use of computers to statistically estimate complicated functions and a decreased emphasis on proving confidence intervals around these functions[.]2
ML:应用统计学的一种框架。(更具现实意义的一种定义,这里更多倾向于DL)[2]
关于策略设计:
在信息流等这种产品,策略的设计其实本质也需要一个“框架”(infra),在这个框架下去优化各个指标(模块需要特定的tech driver),要保证策略框架本身有足够的“开放性”,可以持续的迭代优化。
Refer
[1]:
https://blog.csdn.net/bigheadyushan/article/details/77952219
[1]
https://www.kdnuggets.com/2018/12/essence-machine-learning.html