回归问题评价函数
序
本次记录如下:
RMSE、MAE、MAPE、R-Square
RMSE
(均方根误差)
均方根误差是用来衡量观测值同真值之间的偏差,其计算方式类似于L2范数,因此RMSE对异常值较为敏感,因此该损失函数会对噪声点赋予给高的权重,也就是要牺牲一些正常点的预测精度。
MAE
(平均绝对误差)
其计算方式类似于L1范数,更好地反应预测值误差的真实情况,也就是反映了模型的准确性
MAE相对于RMSE或是MSE来说,更偏向预测那些正常点,也就是变化幅度不大的点,因此在有噪声数据干扰的情况下,可选用MAE。
使用MAE损失(特别是对于神经网络)的一个大问题是它的梯度始终是相同的,这意味着即使对于小的损失值,其梯度也是大的。这对模型的学习可不好。为了解决这个问题,我们可以使用随着接近最小值而减小的动态学习率。
MAPE
(平均绝对百分误差)
MAPE不仅考虑了真实值与预测值之间的误差,同时考虑了误差与真实值之间的比例,也就是很好地评价了模型的稳定性。
例如0.5预测为1,5.0预测为4.5,这两个之间的差距是跟大的,不单单是都只相差0.5
因此,对于不同区域的不同时间段,其base值不同,mape指标较好地刻画了模型对于不同区域不同时段的预测稳定性。
R-Square
利用数据拟合一个模型,你的模型肯定是存在误差的,那么回归方程对观测值拟合的怎么样,就叫做拟合优度,这里的R-square,就是度量拟合优度的一个统计量,即常说的r方,它叫做可决系数,它的计算方法为:
看这个式子式用1减去y对回归方程的方差(未解释离差)与y的总方差的比值,y减去y尖也就是残差,是拟合方程中不能解释的部分,用1减去不能解释的部分,那么剩下的就是解释的部分,也就是说自变量解释了因变量变动的百分比的多少,那么r方的值肯定是越大越好,意味着该模型把y的变动解释得好,R方的范围显然是0到1,在预测实践中,人们往往采纳R方最高的模型。如果结果是 0,说明模型拟合效果很差;如果结果是 1,说明模型无错误。一般来说,R-Squared 越大,表示模型拟合效果越好。R-Squared 反映的是大概有多准,因为,随着样本数量的增加,R-Square必然增加,无法真正定量说明准确程度,只能大概定量。
除此之外,拟合优度还有另一个测定指标是相关系数,相关系数的公式:
相关系数有正负,正意味着因变量随自变量递增,拟合直线从左到右上升,反之意味着递减,从左到右下降。相关系数的意义不像可决系数那样明显,但也有类似的意义,与可决系数同理,它越接近于+1或者-1,拟合程度越好。
对比
直观来说,我们可以像这样考虑:对所有的观测数据,如果我们只给一个预测结果来最小化MSE,那么该预测值应该是所有目标值的均值。但是如果我们试图最小化MAE,那么这个预测就是所有目标值的中位数。我们知道中位数对于离群点比平均值更鲁棒,这使得MAE比MSE更加鲁棒。
如果离群点是会影响业务、而且是应该被检测到的异常值,那么我们应该使用MSE。另一方面,如果我们认为离群点仅仅代表数据损坏,那么我们应该选择MAE作为损失。