技术心得

成功的机器学习项目的关键要素

2018-04-30  本文已影响4人  Eric_i33

1、充分吃透业务逻辑:它关系到后续取数的逻辑,正负例的定义,特征工程的构造等;

2、充足的数据量:它定义了场景所能达到效果的上限;

3、严格的数据清洗与标记:糟糕的处理,如混乱的正负例标记,将使任何优秀的算法失灵;

4、合理的特征工程:特征构造、特征缩放(MinMaxScaler, StandardScaler)、特征选择(过滤、搜索),兵不在多在于精(2^f = n);

5、合适的算法选型:聚类,分类,回归,集成;

6、调参的艺术:学习曲线(固定模型复杂度,通过样本量递增观察预测效果),复杂度曲线(固定样本量,通过调节模型复杂度观察预测效果),网格搜索 + 交叉验证。

sklearn 算法选型指南
上一篇 下一篇

猜你喜欢

热点阅读