大数据,机器学习,人工智能人工智能/模式识别/机器学习精华专题机器学习与数据挖掘

什么是机器学习?机器学习概念性介绍

2019-04-22  本文已影响0人  LKY_d1b3

首发于公众号:一刻AI。

机器学习的概念性介绍


从可编程计算机问世开始,人类就已经在思考如何使得机器变得更加智能化,去赋予机器人性化的思考能力和严谨的学习能力。人工智能的研究历史有着一条从以“推理”为重点,到以“知识”为重点,再到以“学习”为重点的自然、清晰的脉络。作为人工智能的一个分支,机器学习是实现人工智能的一个途径,即以机器学习为手段解决人工智能中的问题。如今,机器学习已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、证券市场分析语音和手写识别、战略游戏和机器人等领域。


1、机器学习的定义

话说有小明和小红去买柚子,傻小明随便拿了一个就要去称重,这时小红告诉他挑柚子有方法,显然皮薄肉多、甜美多汁的柚子是我们想要的,这时候要先看形状、再试重量、并且红心的比白心的更甜美,于是傻小明学习到了一些挑柚子的经验,进化成了小聪明,成功买到了一个优质蜜柚。

电脑程序同样也可以根据所提供的数据进行自动学习,机器学习的定义为:电脑程序要完成任务T(买柚子),如果电脑获取关于T的经验E(形状、重量)越多就表现P(皮薄且甜)的越好,那么就可以说这个程序“学习”了关于任务T(挑柚子)的经验。

从机器学习的定义我们可以看出,机器学习聚焦于研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。


2、机器学习的分类

根据机器有没有被提供类别标签信息,机器学习算法可主要分类两类:监督学习和无监督学习。

下图可以一目了然的区分监督学习和无监督学习:


3、分类和回归的那些事

之前和朋友探讨机器学习的概念性问题,发现他对分类和回归的问题有些分不清楚,在这里做一下简单的介绍。同样,我们从一个故事开始讲起。

提到回归问题,就不得不提到著名的统计学家弗朗西斯·高尔顿。提起这个人大家可能不太熟悉,但是说起他的表哥就无人不知无人不晓了:生物学家达尔文。弗朗西斯·高尔顿深受其表哥提出的进化论思想的影响,试图把该思想引入到人类研究。他着重研究个别差异,从遗传的角度研究个别差异形成的原因,开创了优生学。他在研究祖先与后代身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们父母平均身高高。Galton 把这种后代的身高向中间值靠近的趋势称为"回归现象"

高尔顿是利用祖辈的平均身高X和子代身高Y进行数据上的分析,总结来说:我们利用给定数据,然后运用学习算法,做出预测性判断的过程叫做回归。严谨的说:回归是指当输入变量和输出变量均为连续变量时,输入与输出变量之间的统计关系。即通过收集X与Y来确定实际上存在的关系模型:收集X、Y,从而确定模型。

而分类问题一般指输出变量为有限个离散变量的预测问题,比如输出为真or假,0 or 1。这也是为什么在分类问题中,假设函数要为sigmoid形式,其代价函数要进行一些log上的处理(此处涉及到微积分方面的问题,感兴趣的同学可以自行搜索Logistics回归了解)。

总结回归和分类问题就是:回归是预测连续变量输出的问题、分类是预测离散类标签输出的问题(当然,在一定情况下回归问题和分类问题是可以相互转换的,在这里就不多赘述了)。


一刻AI,扫码关注!

上一篇 下一篇

猜你喜欢

热点阅读