深度学习

机器学习的通用工作流程

2019-03-29  本文已影响0人  庵下桃花仙

1 定义问题,收集数据集

2 选择衡量成功的指标

精度?准确率?召回率?客户保留率?衡量成功的指标指引我们选择损失函数。

问题 衡量成功的指标
平衡分类问题(每个类别可能性相同) 精度或接受者操作特征曲线下面积(area under the receiver operating characteristic curve, ROC AUC)
平衡问题 准确率和召回率
排序问题或多标签分类 平均准确率均值(mean average precision)

3 确定评估方法

4 准备数据

5 开发比基准更好的模型

这个阶段的目的是获得统计功效(statistical power),开发一个小模型,打败随机基准(dumb baseline)。如MNIST中,任何精度大于0.1可以说具有统计功效。
还需要选择3个关键参数

问题类型 最后一层激活 损失函数
二分类问题 sigmoid binary_crossentropy
多分类、单标签问题 softmax categorical_crossentropy
多分类、多标签问题 sigmoid binary_crossentropy
回归到任意值 mse
回归到0到1范围内的值 sigmoid mse或binary_crossentropy

6 增大模型规模:开发过拟合的模型

1、添加更多的层
2、让每一层变的更大
3、训练更多的轮次

7 模型正则化与调节超参数

一旦开发出满意的模型配置,在所有可用数据(训练数据+验证数据)上训练模型,在测试集上最后评估一次。如果性能差,则意味验证流程不可靠,或者调参时验证数据上过拟合,选择更可靠的评估方法,如重复K折验证。

上一篇下一篇

猜你喜欢

热点阅读