感知机模型原理(一)
2019-01-27 本文已影响1人
徐_清风
1. 感知机模型
感知机是二分类模型,旨在找到一个可以将输入空间划分为正负两类的超平面。
假设输入空间是, 输出空间是, 由输入空间到输出空间的感知机模型函数为:
其中, w和b为感知机模型参数, 叫做权值或者权值向量, 叫做偏置, sign是符号函数
我们的目标是找到这样一个超平面S, 即:
超平面S可将输入空间分为正负两类。
如果存在某个超平面S能够将数据集D中的正实例点和负实例点完全地划分到超平面S的两侧,则称数据集D线性可分, 否则, 线性不可分。
2. 损失函数
假设训练集是线性可分的,那么我们要确定超平面S,即确定感知机模型参数w和b。
如何确定最优的模型参数?能够最小化误分类点到超平面S的总距离,对于输入空间中任一点到超平面S的距离为:
其中是的L2范数,对于误分类的数据点来说
因此,误分类点到超平面S的距离是
那么,所有误分类点到超平面S的总距离为:
其中M为误分类点的集合,如果不考虑,得到的就是感知机模型的损失函数:
误分类点越少,损失函数的结果就越小,特别地,当没有误分类点时,损失函数的结果为0。
参考:
李航博士著《统计学习方法》