机器学习和人工智能入门机器学习

机器学习(一)

2017-09-24  本文已影响0人  quo_vadis

一.机器学习的概念

    生活中我们可以利用过去的经验来分析并解决当前遇到的新问题,计算机也可以做同样的事情——即机器学习(Machine Learning)
    机器学习致力于研究通过计算手段,利用经验来改善系统自身的性能。这里所谓的经验指的是就是数据。通过学习算法对输入的数据进行学习,得出的模型,即从数据中学习到的结果。


二.基本术语

例如:(年龄=小明;性别=男性;身高=175),(年龄=小红;性别=女性;身高=165) 这样一组数据

学习任务的分类

  1. 监督学习(supervised learning),即训练数据具有标记信息,且有反馈(feedback)
  1. 无监督学习(unsupervised learning),即训练数据没有标记信息,且没有反馈(feedback)

三. 假设空间与归纳偏好

    学习的过程就是在所有假设(hypothesis)组成的空间中进行搜索的过程,目标是找到与训练集匹配(fit)的假设。假设的表示一旦确定,假设空间的规模和大小就得到了确定(即假设的数量)。
    但是,现实中的实际问题会面临很大的假设空间,但学习过程是基于有限样本训练集进行的。因此,可能会存在多个假设与训练集一致的情况,我们称之为版本空间(version space)
    由于版本空间的存在,可能导致面临新样本的时候,会产生截然不同的结果。这时候,需要一定的策略对学习结果作出选择,这种策略就是归纳偏好,相当于模型的一种“价值取向”。如若不然,就会被训练集上的等效假设所迷惑,从而无法产生学习结果。
    实际上,算法在不同的问题和情况下好坏程度是不一样的。换句话说,模型的总误差与学习算法性能并没有实际关系!(数学证明略 P8)。因为不同的算符针对具体的问题会有相对的优劣,一旦脱离了具体问题,空泛地谈论哪个算法更加优秀是没有意义的。
   总之,就是具体问题要具体分析。


四.发展历程与应用现状

  1. 搜索引擎
  2. 生物工程
  3. 广告推荐
  4. 自动驾驶
  5. 总统竞选(=。=)
上一篇下一篇

猜你喜欢

热点阅读