多分类问题

2017-05-26  本文已影响0人  程序猿爱打DOTA

“一对一”,OvO: 产生N(N-1)个分类器,测试时,新样本提供给所有分类器,取结果中预测最多的类别作为最终结果

“一对多”,OvR:   产生N个分类器,在预测时,若只有一个分类器预测为正类,则对应的类别标记为最终分类结果。若有多个分类器预测为正例,则通常考虑各个分类器的预测置信度,选择置信度最大的类别标记作为分类结果。


"多对多',MvM: 每次将若干类作正例,剩余的作负例,不能随便划分,最常用的技术“ECOC” 纠错输出码;

OvO和OvR都是MvM的特例

编码:对N 个类别做M次划分,每次划分将一部分类别划为正例,一部分划为反例,训练M个分类器

解码:M个分类器分别对测试样本进行预测,这些预测标记组成一个编码,将这个预测编码与每个类别各自的编码进行比较,返回其中距离最小的类别作为最终预测结果。 

详见西瓜书P65

编码矩阵: 二元码:正类,反类; 三元码:正类,反类,停用类

ECOC编码对分类器的错误有一定的容忍和修正能力,ECOC越长,纠错能力越强。


如果希望为一个样本同时预测出多个类别标记,这个任务就不再是多分类学习,而是“多标记学习”,这是机器学习领域,近年来相当活跃的一个研究领域。

上一篇下一篇

猜你喜欢

热点阅读