[机器学习] End-to-End流程

2018-12-16  本文已影响0人  数据麻瓜

Reference: Hands-on Machine Learning with Scikit-Learn and Tensorflow

1. 确定需求和问题:
- 项目目标是什么?
- 在产品中如何实现?
- 是否有现行的模型或方法,如果有的话,是什么,效果怎么样?
- 要求是batch-learning还是online learning?
- 用哪些指标来衡量模型好坏?指标合理吗?
- 模型的最差结果应该比什么好(eg.现有的、盲猜等)
- 是否有可以迁移学习的模型?(之前碰到过NLP相关的,那doc2vec是否可以利用原先train好的)
- 列一下assumptions? 确认这些assumption是否正确

2. 数据提取:

3. 数据探索:

4. 数据准备:

5. 确定一些待用模型(此步骤不调参):

6.确认模型:

7. Presentation:

上一篇 下一篇

猜你喜欢

热点阅读