10.应用机器学习的建议(Advice for applying

2019-03-19  本文已影响0人  justinwei

第六周 lecture 10

对于一个线性回归
J(\theta)=\frac1{2m}[\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)}) + \lambda\sum_{j=1}^n\theta_j ]

当发现预测值不对时,可能的步骤包括以下:

  1. 评估假设(Evaluation a hypothesis)
    1).将数据集按以下比例分拆:
数据占比 描述
60% 训练集Training set
20% 验证集 cross validation set
20% 测试集 test set

2). 误差(error)计算
J_{train}(\theta)=\frac1{2m}\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)})^2
交叉验证误差(cross validation error)
J_{cv}(\theta) = \frac1{2m_{cv}}\sum_{i=1}^{m_{cv}}(h_\theta(x_{cv}^{(i)})-y_{cv}^{(i)})^2
3). 误差分析

  1. 学习曲线(Learning curves)
    高偏差曲线(High bias), 增加训练数据量无法解决欠拟合问题。


    高偏差曲线

    过拟合(High variance) 增加训练数据量可以解决问题过拟合的问题。


    High variance
  2. 神经网络与过拟合(neural networks and overfitting)
上一篇 下一篇

猜你喜欢

热点阅读