面试工程体系篇

2018-04-02  本文已影响67人  彭健平6点30

1、数据简单查看参考

注:有一些算法,比如组合算法,要求分类变量为因子行变量;层次聚类,要求是一个距

离矩阵,可以通过str函数进行查看数据类型要求,有些算法对

注:可以初步观察是不是有量纲的差异,为后续的分析做准备

注:可以为后续数据抽样做准备,看是否产生类不平衡的问题

2.数据缺失值处理

3.数据异常值处理

4.数据的抽样

注:比如决策树算法中,如果样本严重不平衡,那么模型会出现欠拟合现象

5.变量的多重共线性处理

WechatIMG1336.jpeg WechatIMG1337.jpeg 屏幕快照 2018-04-02 16.08.58.png
上一篇 下一篇

猜你喜欢

热点阅读