机器学习基本概念

2022-05-31  本文已影响0人  sarashang

基本概念

  1. 科学推理手段
    归纳:特殊到一般
    演绎:一般到特殊
  2. 监督学习与无监督学习
    监督学习:有明确的答案。分类包括二分类和多分类。二分类就是正负;多分类要选择哪一种特征种类。
    分类离散,回归连续。
    无监督学习:没有明确的答案。聚类(cluster)
  3. 预测
    测试样本
    泛化能力:可预测的范围。

模型评估与选择

1.一种训练集一种算法

1.1 经验误差与过拟合

1.2 评估方法(训练集验证集与测试集)(如何获得测试结果?)

3)自助法

1.3 性能度量 (如何评估性能优劣?)

1.3.1 错误率与精度
1.3.2 查准率、查全率与F1
1.3.3 代价敏感错误率与代价曲线

2. 一种训练集多种算法

2.1 P-R图像
查全率(Recall)
查准率(Precision)
2.2 ROC与AUC


ROC曲线与AUC示意图.png

3. 多种训练集一种算法

3.1 代价敏感错误率与代价曲线

image.png

代价曲线:非均等代价下,直接反映出学习器的期望总体代价。


正例代价概率.png

3.2 偏差与方差

4. 测试集上的性能多大程度可保证真实性能 (如何判断实质差别? )

4.1 比较检验

4.1.1 一个测试集一种算法

4.1.2

参考资料:

  1. k折交叉验证_tianguiyuyu的博客-CSDN博客_k折交叉验证
  2. 训练集,验证集,测试集(以及为什么要使用验证集?)(Training Set, Validation Set, Test Set) - HuZihu - 博客园 (cnblogs.com)
  3. 查全率(Recall),查准率(Precision),灵敏性(Sensitivity),特异性(Specificity),F1,PR曲线,ROC,AUC的应用场景 - HuZihu - 博客园 (cnblogs.com)
  4. 分类模型的性能评价指标(Classification Model Performance Evaluation Metric) - HuZihu - 博客园 (cnblogs.com)
  5. 代价敏感错误率与代价曲线lg23:59的博客-CSDN博客代价敏感错误率与代价曲线
  6. 机器学习(周志华)第2.3.4节中,代价曲线的理解? - 知乎 (zhihu.com)
  7. 模型评估与选择(后篇)-代价曲线青雲-吾道乐途的博客-CSDN博客代价曲线
  8. Paper: Cost curves: An improved method for visualizing classifier performance
上一篇 下一篇

猜你喜欢

热点阅读