一文搞懂支持向量机
2019-07-15 本文已影响75人
somenzz
最近,我掉链子了。这让我意识到,学习必须天天坚持,放弃了第一天,就会有第二天,直到对不学习感到麻木,于是感叹,我又回到了堕落的日子,浑浑噩噩。
日更,总会为不知道写什么而发愁。我想了想,其实把自己当天所学,用自己的话尽可能让读者能够看懂,我觉得这就是写作的意义了。
今天分享下支持向量机,希望你能够看懂,也请多多留言交流。
什么是支持向量机
机器学习最基本的应用就是分类,支持向量机这种算法也不例外。假如给定一批训练数据集,以二维坐标系为例,如下图所示
如何区分这两类数据呢,就是找到一条直线,可以完美的将这两类数据分开,遇到新数据时,直接看此数据在直线的哪一边,即为那一种分类。
如果数据集线性不可分,那么就是找到可以分隔样本的曲线。对于三维,就是找到这样的平面或者曲面,更高维的话就是超平面。不论是一维、二维或是 n 维,我们都叫它超平面。
我们把找到最优的这个超平面的算法叫做支持向量机。
为什么要学习支持向量机
支持向量机有着其他算法不具有的优点:
1、不需要太多样本。虽然在机器学习中,训练的样本越多越好,但支持向量机能在较少的样本下,达到更高的准确率。
2、支持向量机在高维或无限维空间中构造超平面或超平面集合