人工智能

AI数学基础35-Regression、Classificati

2018-07-04  本文已影响12人  LabVIEW_Python

机器学习大致可以分为监督学习(Supervised)和无监督学习(Unsupervised

监督学习回答的是“对于输入数据X能预测变量Y”

无监督学习回答的是“从数据X中能发现什么”。对于X,可能要回答“构成X的最佳6个数据簇都是哪些”或者“X中哪3个特征最频繁共现”

回归(Regression)和分类(Classification)属于监督学习的方法;类聚(Clustering)属于非监督学习的方法

监督学习中,若预测结果是一个连续的值,那么是回归(Regression),比如根据年龄,职业、性别预测工资;

监督学习中,若预测结果是一个离散的值,那么是分类(Classification),比如区别男女,判断好坏。

聚类(Clustering)是一种无监督学习,它将类似的对象归到同一个簇中。有点像全自动分类。聚类方法可以应用所有对象,簇内的对象越相似,聚类的效果越好。聚类方法先并不知道任何样本的类别标号,希望通过某种算法来把一组未知类别的样本划分成若干类别。

聚类和分类最大的区别在于,分类的目标实现已知。

聚类产生的结果和分类相同,只是类别没有预先定义。

通常,人们根据样本间的某种距离或者相似性来定义聚类,即把相似的(或距离近的)样本聚为同一类,而把不相似的(或距离远的)样本归在其他类。 

上一篇 下一篇

猜你喜欢

热点阅读