网络数据挖掘-L9 SVM 决策树

2018-07-12  本文已影响0人  gb_QA_log

title: 网络数据挖掘-L9 SVM 决策树
date: 2017-07-26 11:48:56
categories: Datamining
mathjax: true
tags: [webDataMining]


L9 Decision Trees & SVM

Decision Trees:ID3算法-CSDN博客

决策树的构造思路

ID3算法:

所以需要引入两个概念:

ID3的缺点

决策树的缺点

SVM

general idea

Paste_Image.png
在样本空间里,w^Tx+b=0划分平面,且要使得 \frac{2}{||w||} 最大,等价于||w||^2=w^Tw最小
对于测试数据,
\begin{cases}
w^Tx_i+b \geq 1, &\quad y_i = +1 \
w^Tx_i+b \leq -1,&\quad y_i = -1
\end{cases} Paste_Image.png

||w||^2=w^Tw最小,是一个凸二次规划(convex quadratic programming)问题,用Lagrange multiplier \alpha _i \geq 0得到其对偶问题(dual problem),可以高效求解。

Q(\alpha)=\sum \alpha_j - \frac{1}{2}\sum \sum \alpha_i \alpha_j y_i y_j x_i^Tx_j
(1)\sum \alpha_iy_i=0
(2)\alpha_i \geq 0,for all \alpha_i
w=\sum \alpha_iy_ix_i,b=y_k-\sum \alpha_i y_i y_j x_i^Tx_k ,for any a_k >0
f(x)=w^Tx+b
详见西瓜书

kernel trick 核函数

详见西瓜书

soft margin & solving

详见西瓜书

上一篇 下一篇

猜你喜欢

热点阅读