哲哲的ML笔记（十三：多类别分类）

2021-03-27 本文已影响0人沿哲

如何使用逻辑回归 (logistic regression)来解决多类别分类问题，通过一个叫做"一对多" (one-vs-all) 的分类算法

eg1：假如说你现在需要一个学习算法能自动地将邮件归类到不同的文件夹里，或者说可以自动地加上标签，那么，你也许需要一些不同的文件夹，或者不同的标签来完成这件事，来区分开来自工作的邮件、来自朋友的邮件、来自家人的邮件或者是有关兴趣爱好的邮件，那么，我们就有了这样一个分类问题：其类别有四个，分别用 $y=1,2,3,4$ 来代表

对于一个二分零、多类分类问题，我们的数据集或许看起来像这样

现在我们有一个训练集，好比上图表示的有3个类别，我们用三角形表示 $y=1$ ，方框表示 $y=2$ ，叉叉表示 $y=3$
先从用三角形代表的类别1开始，实际上我们可以创建一个，新的"伪"训练集，类型2和类型3定为负类，类型1设定为正类，我们创建一个新的训练集，如下图所示的那样，我们要拟合出一个合适的分类器。