机器学习

【机器学习】特征工程:特征组合

2021-10-27  本文已影响0人  宅家学算法

  为了提高复杂关系的拟合能力,在特征工程中经常会把一阶离散特征两两组合,构成高阶组合特征,即不同类型或者不同维度特征之间的交叉组合。可以进行组合的特征包括离散特征和连续特征,但是连续特征需要进行一定的处理(如分桶等)后才可以进行特征组合。
  一般的特征组合可以理解为两个离散特征和特征交叉合并,如特征A有m个类别,特征B有n个类别,则特征A和特征B的组合就是将特征A、B中的各个类别两两组合,其维度为m*n。
  特征组合具备一个极为明显的隐患,即当一个特征的类别非常多的时候会出现组合特征向量维度极高的情况,这个时候就需要用到降维处理了。常用的将为处理有:

上一篇 下一篇

猜你喜欢

热点阅读