2020 机器学习之SVM(2)

2020-01-15 本文已影响0人 zidea

machine_learning.jpg

之前我们已经学习如何在等式约束条件，随后又加入了不等式约束条件下最函数最优解，也就是 KKT 条件。有了这些基础今天我们继续 SVM 算法推导。我们在高维空间中我们会找到 N 个超平面作为这些点分割平面，这些平面都可以将所属不同类别点分开，但是我们需要找到一条具有更好泛化能力的直线将这些点分开，这是我们目标函数。

image

那么什么样超平面是我们要找的超平面呢? 我们找到这样一个平面，将平面分别上下（这里所谓上就是平面的法线方向）移出两个间隔平面（下图棕色线），这些线穿过至少一个属于类别点。这些点就是支撑点，也是 SVM 中关键，我们目标就是让个两个边界平面间隔最大。

image

换一个角度来解释一下 SVM

我已经多次尝试去解释过 SVM ，每一次解释都是建立对 SVM 理解的一次更新基础上，今天再给我一次机会来说明清楚 SVM。我们在线性可分两类样本之间存在多条分隔线(超平面)。我们需要找到一最佳的超平面，那么怎么找到这个最佳超平面是问题关键。什么是最佳，也就是让两类点间真空地带尽量大，那么什么是真空地带。地带也就是需要两条线来进行划分，真空地带是由两条边界线划分出，这两条线满足两个条件一个条件就是满足平行于分隔超平面，并且他们至少通过一个样本点，分别位于超平面两侧，两个分隔线之间距离可能是 h ，我们可以通过对数据进行处理现象缩放。