3.2 Types of Learning -Learning

2018-07-17  本文已影响129人  努力奋斗的durian

文章原创,最近更新:2018-07-17

学习链接:
3.2 Types of Learning -Learning with Different Data Label

学习参考链接:
1、台湾大学林轩田机器学习基石课程学习笔记3 -- Types of Learning

现在再来讲一下机器学习的变形,从多类别的案例,美国不同硬币的辨别出发.之前是根据收集美国铜板的大小以及重量都收集好,然后将这些资料提供给机器学习.然后机器会提供g.一般把这种方法叫做监督式学习.


如果我们拿到的训练样本D既有输入特征x,也有输出yn,那么我们把这种类型的学习称为监督式学习(Supervised Learning)。监督式学习可以是二元分类、多元分类或者是回归,最重要的是知道输出标签yn.

与监督式学习相对立的另一种类型是非监督式学习(Unsupervised learning)。非监督式学习是没有输出标签yn的,典型的非监督式学习包括:聚类(clustering)问题,比如对网页上新闻的自动分类;密度估计,比如交通路况分析;异常检测,比如用户网络流量监测。通常情况下,非监督式学习更复杂一些,而且非监督的问题很多都可以使用监督式学习的一些算法思想来实现。

介于监督式和非监督式学习之间的叫做半监督式学习(Semi-supervised Learning)。顾名思义,半监督式学习就是说一部分数据有输出标签yn,而另一部分数据没有输出标签yn。在实际应用中,半监督式学习有时候是必须的,比如医药公司对某些药物进行检测,考虑到成本和实验人群限制等问题,只有一部分数据有输出标签yn。

主要是应用在:

特点是:要找到标记是因为很贵很费时间,这种情况就需要用到半监督学习.需要用到大部分未标的资料让机器学习自动学习.

监督式、非监督式、半监督式学习是机器学习领域三个主要类型。除此之外,还有一种非常重要的类型:增强学习(Reinforcement Learning)。

增强学习中,我们给模型或系统一些输入,但是给不了我们希望的真实的输出y,根据模型的输出反馈,如果反馈结果良好,更接近真实输出,就给其正向激励,如果反馈结果不好,偏离真实输出,就给其反向激励。不断通过“反馈-修正”这种形式,一步一步让模型学习的更好,这就是增强学习的核心所在。

增强学习可以类比成训练宠物的过程,比如我们要训练狗狗坐下,但是狗狗无法直接听懂我们的指令“sit down”。在训练过程中,我们给狗狗示意,如果它表现得好,我们就给他奖励,如果它做跟sit down完全无关的动作,我们就给它小小的惩罚。这样不断修正狗狗的动作,最终能让它按照我们的指令来行动。实际生活中,增强学习的例子也很多,比如根据用户点击、选择而不断改进的广告系统

应用场景:

简单总结一下,机器学习按照数据输出标签yn划分的话,包括监督式学习、非监督式学习、半监督式学习和增强学习等。其中,监督式学习应用最为广泛。


题目练习:



一个公司想要做树的辨识系统,收集很多树的照片,让公司的员工进行标记,里面是有树还是没有树.但是很多其他的照片是没有标记,这个演算法到底是解决什么样的问题?
答案是3,半监督学习.

上一篇 下一篇

猜你喜欢

热点阅读