机器学习基本概念(二)

2018-05-10  本文已影响0人  _不辞而别

上一篇介绍了分类和回归两类任务,这两类任务是按照机器学习可以解决的问题来分类的,下面我按照机器学习在算法上进行分类。

  1. 监督学习
  2. 非监督学习
  3. 半监督学习
  4. 增强学习

监督学习

给机器学习的训练数据拥有“标记”或者“答案” MNIST数据集.PNG

第一行到最后一行都有“标记”(1.2.3...8.9)
监督学习是给定了机器数据的特征,又给定了机器数据正确的“答案”

监督学习算法:

非监督学习

非监督学习.PNG

给机器的训练数据没有任何“标记”或者“答案”

非监督学习的意义
聚类分析.PNG

半监督学习

一部分数据有“标记”或者“答案”,另一部分数据没有
更常见:各种原因产生的标记缺失
通常都先使用无监督学习手段对数据做处理,之后使用监督学习手段做模型的训练和预测

增强学习

根据周围环境的情况,采取行动,根据采取行动的结构,学习行动方式。 增强学习.PNG

Agent 算法
reward 奖赏
state 惩罚
action 行动
environment 环境

算法 采取行动,环境反馈给算法奖赏和惩罚,算法做出相应的调整再对环境采取行动。通过行动反馈,增强自己的智能。增强学习非常适合机器人。 AlphaGo.PNG
AlphaGo就是在对局中进行增强学习。
增强学习:
上一篇 下一篇

猜你喜欢

热点阅读