大数据,机器学习,人工智能机器学习和人工智能入门机器学习与数据挖掘

机器学习笔记00-导论

2019-06-30  本文已影响0人  化简可得

目录

1.什么是机器学习

2.机器学习的种类

3.相关名词释义

1. 什么是机器学习

人的一生在不断学习,广义的学习包含观察世界、认识世界、形成世界观、改造世界的过程。我们通过眼睛观察生活,通过大脑思考其中的联系和规律,从而规划自己的人生路径,这是人的学习。我们总结自己和前人的经验,未来生活中遇到类似的事情,能够找到应对之法,这也是人的学习。

机器学习与人的学习一样,只不过学习主体从人变成了计算机,学习的对象变成了数据。计算机从数据中经过分析获得规律,并利用规律对未知数据进行预测,这一过程便是机器学习。 

在吴恩达的课上,他引用了一段英文定义:

A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

这段话中,E指积攒的经验和数据,统计学中我们称为样本和特征;T是我们想达成的任务,即目标;P是机器学习的评价指标

举个例子,训练计算机判断收到的电子邮件是否为垃圾邮件。这个任务中,E是历史邮件以及人为标记的该邮件是否为垃圾邮件的标签;T是判断新邮件是否为垃圾邮件;P是正确分类的比例。

2. 机器学习的种类

监督式学习:训练集有明确答案,监督学习就是寻找问题(又称输入、特征、自变量)答案(又称输出、目标、因变量)之间关系的学习方式。监督学习模型有两类,分类和回归。

• 分类模型:目标变量是离散的分类型变量。

• 回归模型:目标变量是连续性数值型变量。

无监督学习:只有数据,无明确答案,即训练集没有标注目标变量。常见的无监督学习算法有聚类,由计算机自己找出规律,把有相似属性的样本放在一组。

3. 相关名词释义

问题:又称输入、特征、自变量,用X表示。

答案:又称输出、目标、因变量,用y表示。

数据:包含问题和答案,训练集和测试集都是数据。

训练集:用于训练模型的数据,即训练过程中用到的问题和答案。

测试集:用于检测模型的好坏,即评估过程中用到的问题和答案。

模型:描述问题与答案之间关系的方法。

训练:学习问题与答案之间关系的过程。

评估:衡量模型好坏的过程。

预测:解决问题的过程。

参考链接

吴恩达课程:https://www.coursera.org/learn/machine-learning​www.coursera.org

超智能体:https://mp.weixin.qq.com/s/D796RaONgH5V40RxNhQ36w

上一篇 下一篇

猜你喜欢

热点阅读