互联网的未来程序员我爱编程

机器学习概述与算法介绍(二)

2018-06-05  本文已影响31人  iOSDevLog
  1. 机器学习概述
  2. 机器学习基本概念
  3. 机器学习基本流程与工作环节
  4. 机器学习中的评估指标
  5. 机器学习算法一览

3. 机器学习基本流程与工作环节


3.1 机器学习应用几大环节

预测模型

image

机器学习算法 / 数据

机器学习的应用工作是围绕着数据与算法展开的

3.2 机器学习不同阶段与作用

数据预处理 Preprocessing

模型评估 Evalution

image

数据预处理 / 模型学习 / 模型评估 / 新样本预测

image

要点总结

4. 机器学习中的评估指标


4.1 机器学习的目标

image

Q: 什么模型好?

A: 泛化能力强! 能很好地适用于没见过的样本

例如,错误率低、精度高

然而,我们手上没有未知的样本......

案例 From 周志华《机器学习》

4.2 机器学习的评估方法

我们手上没有未知的样本,如何可靠地评估?

关键: 获得可靠的“测试集数据”(test set) ?

测试集(用于评估)应该与训练集(用于模型学习)“互斥”

常见方法:

1. 留出法

注意点:

| 全 量 数 据 集 |

| 测试集 | 训练集 |

2. k折交叉验证

image

典型的 10折交叉验证

3. 自助法(bootstrap)

基于“自助采样”的方法(bootstrap sampling) 别称:“有放回采样”、“可重复采样”

约有 36.8% 的样本不出现

image

包外估计(out-of-bag estimation)

关于模型“好坏”的判断,不仅取决于算法和数据, 还取决于当前任务需求。

image

比如:回归(regression) 任务常用均方误差:

image

4.3 机器学习的评估度量指标

要点总结

5. 机器学习算法一览


5.1 机器学习算法一览

image image

5.2 机器学习算法可视化理解

不同算法在完成分类与回归问题时候,有不同的处理方式。

详见课程动态演示

image image image image image

要点总结

附 结合微专业课程的学习


数学基础

讲授具体算法时对涉及数学部分有针对的查漏补缺

算法理解

理解算法核心概念与原理,不同算法差异,不同场景与算法选择

编程基础

结合课程算法的配套案例与代码实现,巩固编程能力

动手实践

结合微专业综合应用部分,案例与机器学习应用“套路”学习

积累项目经验

组织大家积极参与数据科学比赛和讨论

附 参考文献/Reference


上一篇下一篇

猜你喜欢

热点阅读