数据挖掘3

2020-03-31  本文已影响0人  一技破万法

建模调参

内容介绍

  1. 线性回归模型:
    线性回归对于特征的要求;
    处理长尾分布;
    理解线性回归模型;
  2. 模型性能验证:
    评价函数与目标函数;
    交叉验证方法;
    留一验证方法;
    针对时间序列问题的验证;
    绘制学习率曲线;
    绘制验证曲线;
  3. 嵌入式特征选择:
    Lasso回归;
    Ridge回归;
    决策树;
  4. 模型对比:
    常用线性模型;
    常用非线性模型;
    5.模型调参:
    贪心调参方法;
    网格调参方法;
    贝叶斯调参方法

算法原理

线性回归模型

线性回归模型

决策树模型

决策树模型

GBDT模型

GBDT模型

XGBoost 模型

线性回归&五折交叉验证&模拟真实业务情况

五折交叉验证

把数据集中一部分对训练集生成的参数进行测试,相对客观的判断这些参数对训练集之外的数据的符合程度。

正则化模型

L2正则化在拟合过程中通常都倾向于让权值尽可能小,最后构造一个所有参数都比较小的模型。因为一般认为参数值小的模型比较简单,能适应不同的数据集,也在一定程度上避免了过拟合现象。可以设想一下对于一个线性回归方程,若参数很大,那么只要数据偏移一点点,就会对结果造成很大的影响;但如果参数足够小,数据偏移得多一点也不会对结果造成什么影响,专业一点的说法是『抗扰动能力强』
L1正则化有助于生成一个稀疏权值矩阵,进而可以用于特征选择。

模型调参
上一篇 下一篇

猜你喜欢

热点阅读