机器学习-算法理论

策略Infrastructure

2021-09-08  本文已影响0人  shudaxu

何谓好的 Infrastructure

好的infra意味着:
“无论在这些点上用多么山寨雷人的方法去做,只要tech driver的解释能力足够强,那么结果就能得到保证,用机制设计的术语说“social goal will be Nash implement” ”[1]

关于ML体系:

现代的ML体系(TF,pyTorch)本身就是个很好的infra,它具有很好的开放性。

1、核心算法:机器学习算法本身有很强的开放性,容纳任意的目标,特征形式,且能拟合各种复杂目标函数形式。同时,通过特征的优化,模型结构,超参,训练过程的优化,能不断迭代。
2、tech driver:就譬如排序模型中的AUC等指标。虽然不能直接指示最终KPI指标,但是能解释模型的排序能力,在单纯的排序任务中,就有足够强的解释力。在广告等场景,或者多目标排序时,可能还需要CTCVR的AUC,OE等等指标。

对ML本质的定义(Essence of ML):

Tom Mitchell:
A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.1
一种形式上的定义。

Yoshua Bengio:(w2v,attention...)(Hinton, LeCun)
Machine learning is essentially a form of applied statistics with increased emphasis on the use of computers to statistically estimate complicated functions and a decreased emphasis on proving confidence intervals around these functions[.]2
ML:应用统计学的一种框架。(更具现实意义的一种定义,这里更多倾向于DL)[2]

关于策略设计:

在信息流等这种产品,策略的设计其实本质也需要一个“框架”(infra),在这个框架下去优化各个指标(模块需要特定的tech driver),要保证策略框架本身有足够的“开放性”,可以持续的迭代优化。

Refer
[1]:
https://blog.csdn.net/bigheadyushan/article/details/77952219

[1]
https://www.kdnuggets.com/2018/12/essence-machine-learning.html

上一篇下一篇

猜你喜欢

热点阅读