多分类问题

2017-05-26 本文已影响0人程序猿爱打DOTA

“一对一”，OvO：产生N（N-1）个分类器，测试时，新样本提供给所有分类器，取结果中预测最多的类别作为最终结果

“一对多”，OvR: 产生N个分类器，在预测时，若只有一个分类器预测为正类，则对应的类别标记为最终分类结果。若有多个分类器预测为正例，则通常考虑各个分类器的预测置信度，选择置信度最大的类别标记作为分类结果。

"多对多',MvM: 每次将若干类作正例，剩余的作负例，不能随便划分，最常用的技术“ECOC” 纠错输出码;

OvO和OvR都是MvM的特例

编码：对N 个类别做M次划分，每次划分将一部分类别划为正例，一部分划为反例，训练M个分类器

解码：M个分类器分别对测试样本进行预测，这些预测标记组成一个编码，将这个预测编码与每个类别各自的编码进行比较，返回其中距离最小的类别作为最终预测结果。

详见西瓜书P65

编码矩阵：二元码：正类，反类；三元码：正类，反类，停用类

ECOC编码对分类器的错误有一定的容忍和修正能力，ECOC越长，纠错能力越强。

如果希望为一个样本同时预测出多个类别标记，这个任务就不再是多分类学习，而是“多标记学习”，这是机器学习领域，近年来相当活跃的一个研究领域。