机器学习与数据挖掘人工智能/模式识别/机器学习精华专题

吴恩达机器学习笔记(0)——初始机器学习

2018-05-30  本文已影响4人  机智的神棍酱

自学机器学习,在瞎学,学了TensorFlow,只会做个调包侠,做做教程的例子,遇到实际问题,还是两眼一抹黑,于是准备恶补一下机器学习的基础知识。听了网上的推荐就看了《吴恩达机器学习》,感觉挺不错的,所以想把我学的内容记录个笔记,以便于以后遗忘了在回来复习一下,顺便趁热打铁。

1.什么是机器学习

首先Arthur在1959年将机器学习定义为:在没有明确设置的情况下使计算机具有学习能力的研究领域
接着后来Tom Mitchell在1998年将机器学习重新定义为:
一个适当的学习问题定义如下:
计算机程序从经验E中学习解决一任务T
进行某一性能度量P,通过P测定在T上的表现因经验E而提高


机器学习定义

第二个定义可能理解有点难度,举个例子:
让机器学会跳棋,而跳棋游戏的经验E就是程序与自己下几万次跳棋,任务T就是玩跳棋,性能度量P就是与新对手玩跳棋时赢的概率

2.监督学习

监督学习是指给机器一定的训练集,训练集里每个元素都有相应的正确标签。让机器学习这些训练集,来训练出可以达到预期相应的正确标签的模型,也就是说给定机器学习的目标,让机器自己去学习。
举个例子:
假设你要预测房价,你收集了房价信息,并绘制了数据集,就像这样:


房价数据集

横轴是房子的大小,竖轴是房价的多少,有了这些数据,你要训练出一个模型来拟合这些数据以便于你代入其他的数据来预测房价,就好像是找到一条函数符合这些数据。这就是最简单的监督学习,也就是我们说的回归模型。
再举一个例子:
有两类照片,一类是狗,一类是猫,我们给每张照片分好类,做好标签制作出一个数据集。计算机用这些数据,来自己学习分类那个照片是猫那个照片是狗,这也就是分类模型。

3.非监督学习

在机器学习,无监督学习的问题是,在未加标签的数据中,试图找到隐藏的结构。

谷歌新闻

比如谷歌新闻,谷歌新闻会不停的收集不同的新闻页面,谷歌的服务器会自动把这些新闻分类。

上一篇下一篇

猜你喜欢

热点阅读