[图解机器学习] 绪论

2019-04-13  本文已影响0人  小矮人Keep

机器学习的种类

根据处理的数据种类的不同分为:

机器学习任务的例子

  1. 回归
    对一个或多个自变量和因变量之间的关系 进行建模 求解的一种统计方法。

以d维实向量x作为输入 实数y作为输出
真实函数关系y= f(x)是未知的
作为训练集的输入输出样本{(x,y)} 是已知的
一般情况输出样本的y经常会观察到噪声

输入样本x就是 学生向老师提出的问题
输出样本y是老师对学生做出的回答
输出样本的噪声就是老师的教学错误或者学生的理解错误
学生通过学习获得的函数以y=F(x)来表示
那么学生对没有学习过的问题也能做出正确回答的泛化能力 就可以通过比较函数f(x)和F(x)的相似性来分析

  1. 分类
    对于指定的模式进行识别的有监督的模式识别问题

以d维实向量x作为输入样本 而所有的输出样本可以被划分为c个类别
作为训练集的输入输出样本{(x,y)}是已知的
输出样本y代表类别1,2,3...c
学习得到函数关系y=f(x)

  1. 异常检测
    寻找输入样本中所包含的异常数据的问题
    输入样本中 对于什么数据是正常的 什么数据是异常的 是未知的
    在这样的无监督的异常检测问题中,一般采用密度估计的方法,把靠近密度中心的数据作为正常的数据,偏离密度中心的数据作为异常的数据。
  2. 聚类
    与分类问题相似 也是模式识别的问题 但是属于无监督学习的一种
    只给出输入样本{x} 然后判断各个样本分别属于1,2,3,4...c中的哪个簇。
    聚类问题中 经常以 簇 代替 类别
  3. 降维
    指从高维度的数据中提取关键信息,将其转换为易于计算的低维度问题来进行求解的方法
    当输入样本{x}的维度d非常大的时候 可以把样本转换为较低维度的样本{z}
    线性降维的情况下,可以使用横向量T 将其变换为 z=Tx
    根据数据种类的不同 可分为监督学习和无监督学习

机器学习的方法

以对模式x的类别y进行预测的分类问题为例
产生式分类和判别式分类
频率派和贝叶斯派

学习模型

线性模型
核模型
层级模型

上一篇 下一篇

猜你喜欢

热点阅读