花书 机器学习基础 (阅读笔记)
2020-02-06 本文已影响0人
辛兆福
深度学习(花书)
第一部分 应用数学及机器学习基础
第五章 机器学习基础
机器学习本质属于应用统计学,利用计算机统计地估计复杂函数
常见机器学习任务:
- 分类:输出类别码
- 输入缺失分类:在缺失部分输入信息的情况下输出类别码
- 回归:数值预测
- 转录:输出离散文本(文本图片识别,语音识别)
- 机器翻译
- 结构化输出(图像分割,图像描述)
- 异常检测
- 合成和采样
- 缺失值填补
- 去噪
- 密度估计或概率质量函数估计
以数据是否有label区分监督学习与无监督学习
欠拟合:训练误差大
过拟合:测试误差相比训练误差明显较大
k-折交叉验证:数据集分成若干等分,每次取一份为测试集,其余为训练集,后取多次数据的平均值
支持向量机类似与逻辑回归,所不同的是输出值不是概率而是类别