机器学习2——机器学习的分类
本讲的主要内容:
-1.机器学习算法按照任务性质的不同:监督学习+强化学习
--1.1监督学习(supervised learning):所有的经验E都是人工采集并输入计算机的
-----1.1.1传统的监督学习(traditional supervised learning):每一个训练数据都有对应的标签
算法包括:
-----------支持向量机(support vector machine)
-----------人工神经网络(neural networks)
-----------深度神经网络(deep neural networks)
-----1.1.2 非监督学习(unsupervised learning):所有的训练数据都没有对应的标签
算法包括:
-----------聚类(clustering)
-----------EM算法(expectation-maximization algorithm)
-----------主成分分析(principle component analysis)
-----1.1.3半监督学习(semi-supervised learning):训练数据中有一部分有标签,一部分没有标签
--1.2强化学习(reinforcement learning):经验E是计算机与环境互动获得的,逐渐强化自己的行为模式
-2.机器学习算法基于标签的固有属性:
将监督学习分为分类(classification)和回归(regression)
--2.1分类(classification):标签是离散的值
--2.2回归(regression):标签是连续的值
…………………………………………………………………………………………………………………………
——————————————————————————————————————————————
上一讲的作业:
![](https://img.haomeiwen.com/i24181854/3e2bb1fa312644b9.png)
2、3一类,1、4一类
划分的标准是什么:经验E,
![](https://img.haomeiwen.com/i24181854/dd6e106ff098b217.png)
![](https://img.haomeiwen.com/i24181854/c9cd4afb2e22eae7.png)
![](https://img.haomeiwen.com/i24181854/01affe1eb880e8f2.png)
我们把告诉计算机这张人脸是谁的过程称为为训练数据打标签(labeling for training data),因此我们输入计算机的经验E就是训练样本以及他们对应标签的集合,
为数据打标签需要很多的人工,耗费时间巨大,所以数据打标签称为了一个独特的行业,总之2、3共同特点是
![](https://img.haomeiwen.com/i24181854/5f1f80737cfc44de.png)
我们把这种输入计算机训练数据同时加上标签的机器学习称为监督学习,supervised learning
![](https://img.haomeiwen.com/i24181854/c42f9e45c92c6722.png)
1、4中
![](https://img.haomeiwen.com/i24181854/3057e0174c66a49f.png)
计算机产生行为和结果,我们的程序只需要定义这些行为的收益函数(reward function)对行为进行奖励和惩罚,同时要设计算法让计算机自己改变自己的行为模式去最大化收益函数完成机器学习的过程,我们把这一类机器学习的任务称为强化学习(reinforcement learning)意思是
![](https://img.haomeiwen.com/i24181854/b6d129efa97e8c42.png)
1.总结起来按照任务性质的不同
![](https://img.haomeiwen.com/i24181854/e6d4f426877de8a8.png)
这样的划分并不绝对,现代的监督学习中也用到了强化学习
例如alphago中[图片上传失败...(image-7a2c3e-1619167194616)]
我们主要介绍监督学习
2.监督学习可分为三类:
![](https://img.haomeiwen.com/i24181854/9e467b10f3fc6ebe.png)
![](https://img.haomeiwen.com/i24181854/f1a6e215d5fe9565.png)
![](https://img.haomeiwen.com/i24181854/d45116382216f672.png)
![](https://img.haomeiwen.com/i24181854/fa68b223c452eae5.png)
我们为什么可以在没有对应标签的训练数据中获得类别信息呢:
例子:
![](https://img.haomeiwen.com/i24181854/90cb95cf39806f31.png)
在左边的训练样本中标注了训练样本在空间的标注,这是一个传统的监督学习
![](https://img.haomeiwen.com/i24181854/13e48d20ba28b56f.png)
如果是这样我们如何进行分类呢
此时我们需要假设:同一类的训练数据子啊空间中距离更近,我们就可以根据样本的空间信息,设计算法将他们聚焦为两类,从而实现没有无监督学习,
![](https://img.haomeiwen.com/i24181854/ec60a9b2c8c1a2b9.png)
![](https://img.haomeiwen.com/i24181854/18ea1e34cdb26f5f.png)
近年来半监督学习获得了越来越多的关注,这是因为网络中存在大量的数据
但是标注数据却耗费成本,因此如何利用少量的标注数据和大量的未标注数据一起训练一个更好的机器学习算法,
半监督学习的例子
![](https://img.haomeiwen.com/i24181854/d36fd501c40b92f8.png)
例如左边只有俩标注过的训练样本,我们并不知道如何去进行分类,给他增加一些没有标签的训练样本,如右边,我们就可以更准确的设计算法去更好的分类。
3.另一类的分类方法就是基于标签的固有属性,
![](https://img.haomeiwen.com/i24181854/3d49679ee1c6da84.png)
3.1例如人脸识别就是分类问题,
模式一:识别这俩人脸是不是同一个人,如果是,那就是1,如果不是0,标签是离散的0和1的数值,还有另一种模式。
模式二,识别一张人脸是一对人脸中的哪一个,标签还是1,2,3……n,还是离散的,
![](https://img.haomeiwen.com/i24181854/2ded2a31534aa19d.png)
3.2回归
标签是连续的值
例如设计算法预测房价的走势,
![](https://img.haomeiwen.com/i24181854/740e846edfa76f9e.png)
这里的训练样本是时间,标签是房价,标签是连续的变量,同样的
![](https://img.haomeiwen.com/i24181854/ea34360ec2ec3dbf.png)
房价四舍五入到整数,这就是分类问题了,其实分类和回归的界限是很模糊的,因为离散和连续是可以相互转化的,一个解决分类的机器学习问题的模型稍微改一改就可以解决回归问题,因此我们课程的主要研究内容使用机器学习解决分类问题,
总结
机器学习的分类,按照 任务是否要和环境交互获得经验,分为监督学习和强化学习两类,
监督学习分类:首先按照训练数据是否存在标签,分为:传统的监督学习,非监督学习,和半监督学习,
其次按照标签是连续还是离散,分类、回归,
思考
![](https://img.haomeiwen.com/i24181854/f3c3daccfda5602b.png)