AI面试第六弹(评价指标)
一、分类问题指标
分类问题的评价指标多是基于以下混淆矩阵
·真实值是positive,模型认为是positive的数量(True Positive=TP)
·真实值是positive,模型认为是negative的数量(False Negative=FN):这就是统计学上的第二类错误(Type II Error)
·真实值是negative,模型认为是positive的数量(False Positive=FP):这就是统计学上的第一类错误(Type I Error)
·真实值是negative,模型认为是negative的数量(True Negative=TN)
混淆矩阵.png
1、准确率(Accuracy):识别对了的正例(TP)与负例(TN)占总识别样本的比例。
2、精确率(Precision):识别对了的正例(TP)占识别出的正例的比例。其中,识别出的正例等于识别对了的正例加上识别错了的正例。
3、召回率(Recall):识别对了的正例(TP)占实际总正例的比例。其中,实际总正例等于识别对了的正例加上识别错了的负例(真正例+伪负例)。
4、F-Score,是召回率R和精度P的加权调和平均,顾名思义即是为了调和召回率R和精度P之间增减反向的矛盾,该综合评价指标F引入了系数α对R和P进行加权调和
5、ROC曲线,也称受试者工作特征。以FPR为横轴,TPR为纵轴,绘制得到的曲线就是ROC曲线。ROC曲线下的面积即为AUC。面积越大代表模型的分类性能越好。
ROC曲线.png
6、AUC:随机挑选一个正样本以及负样本,算法将正样本排在负样本前面的概率就是AUC值。 M为正类样本的数目,N为负类样本的数目。
特点:AUC的评价效果不受正负样本比例的影响。因为改变正负样本比例,横纵坐标大小同时变化。整体不变。
二、回归问题评价指标:
1、MAE(Mean Absolute Error)是绝对误差的平均值。可以更好地反映预测值误差的实际情况
2、MSE是真实值与预测值的差值的平方然后求和平均。通过平方的形式便于求导,所以常被用作线性回归的损失函数。
3、RMSE(Root Mean Square Error)衡量观测值与真实值之间的偏差。常用来作为机器学习模型预测结果衡量的标准。 受异常点影响较大。
4、R-square(决定系数),分母理解为原始数据的离散程度,分子为预测数据和原始数据的误差,二者相除可以消除原始数据离散程度的影响。
R-square计算公式.png
(此处的R即相关系数,相关系数的平方就是决定系数R-Square。其中分母的y_mean是y_actual的mean。)
分子是残差的平方之和;分母是总方差;把“1减”揉进分式后,变成了“(总方差 - 残差平方和)/ 总方差 ”。
所以,R-Square理解成 “预测的误差的方差”小于实际情况的方差的比例。