SVM(王木头)
2022-11-27 本文已影响0人
皮尔洛_dys
1.SVM 的前提假设是什么?
有一条直线,如果它能够距离两边的数据间隔最大,那么这跟直线就是我们要找的直线(红色直线)。因为如果距离间隔小的话稍微有些抖动就会造成分类错误。
![](https://img.haomeiwen.com/i28387726/1ff49bb00454dfaf.png)
2.最大边界的数学表达
![](https://img.haomeiwen.com/i28387726/5d6b769a09b8f911.png)
其中红线中的公式如果要解决的问题是一个多为问题的话,那么这个直线就是一个超平面。那么这里实际上就是在求一个点到一个超平面的距离的最小值。
![](https://img.haomeiwen.com/i28387726/b8fe4e49467fbdb7.png)
现在我们想知道一个点到一个超平面的距离我们可以这样来思考。
![](https://img.haomeiwen.com/i28387726/60466464ab070dcd.png)
![](https://img.haomeiwen.com/i28387726/d92cc2add0500176.png)
点到直线之间的距离只是条件之一,我们还需考虑另外一个条件即该直线不仅要间隔最大还要能够把所有的点正确分类。那么这一条件该如何用数学公式表达呢?
3.正确分类的数学表达
将不同颜色的样本点标记上数字标签1和-1,Xi代表不同的样本点,如果Xi在直线上方,那么将该点带入超平面公式就是大于0的,反之则小于0.。如果我们能够正确的分类那么样本点的标签与样本点带入超平面方程得到的数值之积应该是>0的。
![](https://img.haomeiwen.com/i28387726/c9ea1edcf5e4e2cb.png)
4.整理过后得到的公式
![](https://img.haomeiwen.com/i28387726/55fb3a6276558f33.png)
5.边界计算表达方式的简化
![](https://img.haomeiwen.com/i28387726/aff3e7ecf5180abe.png)
我们将红框内的部分限制为1,那么整个间隔的大小就可以完全由前面的部分代替了。
![](https://img.haomeiwen.com/i28387726/4f42eff222ed168a.png)