机器学习概念

2020-01-11  本文已影响0人  吴十三和小可爱的札记

资料参考(copy)自ApacheCN项目,推荐学习。

机器学习(Machine Learning,ML)是使用计算机来彰显数据背后的真实含义,它为了把无序的数据转换成有用的信息。是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。

机器学习组成

主要任务

监督学习(supervised learning)

非监督学习(unsupervised learing)

强化学习

这个算法可以训练程序做出某一决定。程序在某一情况下尝试所有的可能行动,记录不同行动的结果并试着找出最好的一次尝试来做决定。 属于这一类算法的有马尔可夫决策过程。

数据集的划分

模型拟合程度

通俗来说,欠拟合和过拟合都可以用一句话来说,欠拟合就是:“你太天真了!”,过拟合就是:“你想太多了!”。

常见的模型指标

机器学习开发流程

  1. 收集数据: 收集样本数据

  2. 准备数据: 注意数据的格式

  3. 分析数据: 为了确保数据集中没有垃圾数据;

    • 如果是算法可以处理的数据格式或可信任的数据源,则可以跳过该步骤;

    • 另外该步骤需要人工干预,会降低自动化系统的价值。

  4. 训练算法: [机器学习算法核心]如果使用无监督学习算法,由于不存在目标变量值,则可以跳过该步骤

  5. 测试算法: [机器学习算法核心]评估算法效果

  6. 使用算法: 将机器学习算法转为应用程序

上一篇 下一篇

猜你喜欢

热点阅读