解剖机器学习（Machine Learning）（科普版）

2017-10-30 本文已影响0人肖玉贤

一、机器学习（ML）概述

2016年，机器学习（machine learning）成为流行词，那什么是ML呢？从算法的角度我暂时是算不出来的（我会请教我身边的智囊团的），因为这篇文稿的整理只为给中小学科普ML，让中小学能够明白机器是如何模拟他们自身的学习的即可。在科普前，我们就暂且高大上一把，把ML的概念呈献给大家，据说计算机是有能力进行学习的，而不是通过预先设定的准确的实现的代码。

这里咱们做个小解剖，从概念里可以做这样的理解：机器可以明白“0”和“1”是什么样子，再出现多个“0”或者类似“0”的实物，它不会将其认为“1”或者类似“1”的实物。因此，这就涉及到学习的概念，涉及两个内容：学习是什么？学习是怎样发生的？放在机器领域就是：机器的学习是什么？机器的学习是怎样发生的？又因为机器学习是模仿人类的学习的实质和机制，那么，ML的本质也依然是探究人的学习是什么，人的学习是怎样发生的，因此称其为人工智能的一个研究领域。

例1：

美国著名的教育心理学家桑代克做过许多动物学习的实验，并用以解释学习的实质与机制，提出了试误学说，这在机器学习的过程中一样适用。那么，我们可以这样理解机器学习的过程：

——2+3=？机器回答：10；——太大了；

——4+5=？机器回答：6：——太小了；

——2+7=？机器回答：9；——答对了

如此机器知道了2+7=9；那么再遇到其他的算式也是一样的，它会在试误中找到合适的答案！在一步步地调整自己学习的方式方法和路径的同时，优化计算的过程，保证尽可能少出错，当它能够完全一次性算出4+5=9；6+5=11等的时候，这时候它的模型拟合就是成功的，可以被投入使用了。

ML就是这样发生的。这也就是百度百科关于ML的定义的一个实例:机器学习（machine learning）是专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

例2：

水果的种类繁多，苹果就有红富士，嘎啦，红玉，金冠等十多种知名的品种，但是，ML更多的是在适应并解决我们学习和生活中需要面对的问题，如何更好的解决。一般呢，我们只需要知道苹果是啥就可以！那么实际上呢，苹果有颜色，富士基本为红色，这时候机器呢就开始学习红色这一个特征；苹果是有圆形的，那么它就学习了圆形这样一个特征；苹果还是有皮、有瓤、有籽的，它依然一一学习了这些特征……这时候机器要认识什么是苹果，它得把这学到的所有特征给整合，也就是我们说的模型拟合了！拟合成功了之后，再给机器一大堆水果（数据）的时候，它就可以识别出苹果是什么了。

但是，存在这样的问题，如果从一开始就界定苹果是红颜色的，那么，再给一个青苹果的时候，机器会默认这不是苹果，那么这就是过拟合，也就是这个模型的构建关注到了本不是苹果最主要的特征，导致学习有误，也就是机器学习时关注到了噪点，影响了学习的结果和反馈！这时候就需要机器做及时的完善，将红色这一个特征，学习成苹果是有颜色的即可，这就更为接近了该有的分类。

另外，也会存在这样的情况，如果构建的模型，只认为苹果特征是圆的，有皮有瓤的，那么给机器一个桃子（圆的，有皮，有瓤），它也会认为这就是苹果！这时候就是机器对苹果特征的学习还不够，这就是欠拟合的结果和反馈了。因此，机器就还需要更多的学习来认识苹果这个事物，也就是机器需要不断的完善和组织自己的知识结构。当得以完善之后，再给于数量多、种类多的一堆水果的时候，机器就会很轻松的区分出苹果和其他水果。

二、机器学习的分类

参照已有的内容和智囊团的介绍，机器学习（ML）可以这样分类:监督学习和无监督学习。先来看看定义：

监督学习：计算机获得简单的输入给出期望的输出，过程是通过一个“训练模型”，学习通用的准则来从输入映射到输出。

无监督学习：没有给出标记用来学习算法，让它自己去发现输入的结构。无监督学习自己可以被当成一个目标或者一个实现结果的途径。

什么意思呢？大家要明确的是：监督学习和无监督学习都属于ML，因此上述的学习过程都是适用的，但是以下的区别还是需要大家明确：

 有无“老师”监督

顾名思义，监督学习是有老师的学习，也就是老师告诉我：遇到了“子曰”“之乎者也”或者“唐诗宋词”等，都将其归置到古文中，因为符合已有的关于古文的标记，那么我看到了“不在沉默中爆发，就在沉默中灭亡”“教育即生活”等语词，我肯定会将其归置在古文之外。机器也是一样的，告诉他古文是咋样的，再来一篇文章，它也是可以区分出来的。

无监督的学习就是没有老师告诉我关于内容的标记。举个我们最常见得到的例子，书桌凌乱无比，我们准备进行整理，这时候书桌上的所有的东西就是数据，那么我们是怎么分类放置的，我们会取某几件将其归为一类，比如放进笔筒内的笔，放在书架上的书，摆在案边的本子等，这时候我们会发现因为每个人的个性特征不一样，我们的关于分类的摆放是不一样的，因此，当下次将各样文具购置回家之后，我们会按照自己的偏好将笔、书或者本子放在已分好类的位置处。那么，机器的学习也是一样的，比如购物的推荐就是这样的，因为每次我们在访问浏览器，进行检索的时候机器都在进行每个人的个人特征爱好的学习，可谓是检索过的内容，机器都知道。这时候，当你检索的时候，会自动为你提供个人的偏好选择。

由于增强学习（另一个类别）还在探索中，因此，姑且科普到这块，上述内容若有不合理的地方，请大家及时提出奥。

——致谢我的师父团——

解剖机器学习（Machine Learning）（科普版）

一、机器学习（ML）概述

例1：

例2：

二、机器学习的分类

 有无“老师”监督

猜你喜欢

热点阅读