稀疏模型优化

2020-10-15 本文已影响0人 shudaxu

NN模型的特点：
在NN方向，稀疏特征多由embeding以及后续的交叉表达来体现（靠模型结构，隐层进行表达）。其优化的方向主要在于，如何将系统中id的embedding学得更好，使其能够反应当前domain，或者不同domain下的相似性，特点，为系统提升更好的泛化效果。

底层设计：对于常见的id特征来说，低频的id和高频的id拥有相同的embeding size（参数量）的话，可能会使高频的id表达能力欠缺（bias大），而低频的id过拟合（variance大），这两者同时会导致泛化误差增大。而且这类NN模型绝大部分参数量是embedding（模型自由度绝大部分由此提供），所以对这部分的优化也尤为重要。

上层设计：上层设计其实也是相对于线性模型的稀疏特征组成来讲的，因为线性模型多做特征交叉，所以其表达的特征，需要在NN的隐层中体现，所以隐层如何更好地抽取学习出特征之间的关系，提炼出交叉的表达便很重要。

所以，NN部分需要依赖底层的设计（针对高低频id的embeding size本身的动态优化）以及上层的设计（针对id之间关系的抽取表达，比如attention，CNN，residual等layer的设计与应用）共同优化稀疏特征的学习

线性模型的特点：
在Linear部分则是对大规模稀疏的交叉特征进行建模，增强模型记忆与更直接关系的推断能力。

系统层面：由于线性部分主要的特点是超高维特征空间，以及超量的参数空间，所以重点是针对这部分优化当前系统的训练以及预估效率。

特征工程层面：由于Linear部分更加依赖特征工程的挖掘，所以在特征的工程，特征的管理，分析上，需要投入一定的注意力。由于特征工程的需求，以及更多复杂特征的构建。需要考虑一定的特征筛选淘汰机制。以适应更大规模的训练迭代。

稀疏模型优化

猜你喜欢

热点阅读