机器学习基石笔记:12 Nonlinear Transforma
2019-05-01 本文已影响3人
cherryleechen
一、二次假设
实际上线性假设的模型复杂度是受到限制的,需要高次假设打破这个限制。
![](https://img.haomeiwen.com/i8016875/6f308bce7e1193fd.png)
假设数据不是线性可分的,但是可以被一个圆心在原点的圆分开,需要我们重新设计基于该圆的PLA等算法吗?
![](https://img.haomeiwen.com/i8016875/6146d950d874f55e.png)
不用,只需要通过非线性转换将域圆形可分变为
域线性可分!
![](https://img.haomeiwen.com/i8016875/de1adb8488624702.png)
![](https://img.haomeiwen.com/i8016875/72b1edf64ee8ad31.png)
![](https://img.haomeiwen.com/i8016875/b16b12b3e5aaddba.png)
二、非线性转换
![](https://img.haomeiwen.com/i8016875/f769b967be026603.png)
![](https://img.haomeiwen.com/i8016875/3c35c7ae16f1ec48.png)
![](https://img.haomeiwen.com/i8016875/ce2e5f9b6985068c.png)
三、非线性转换的代价
计算/存储代价:次数越高,代价越大。
![](https://img.haomeiwen.com/i8016875/70c32dbafbee9292.png)
模型复杂度代价:次数越高,代价越大。
![](https://img.haomeiwen.com/i8016875/a94fda803ccd7d91.png)
高次假设能使样本内代价更小;低次假设能保证泛化误差更小。
![](https://img.haomeiwen.com/i8016875/60ece0abf0c19c34.png)
可视化数据后再选择:
一是数据维度高时难以可视化;
二是可视化后再选择实际上人脑里产生的模型复杂度代价并没有算进去,加上后实际代价不一定很低。
![](https://img.haomeiwen.com/i8016875/2e48b87ac2b0c892.png)
四、结构化假设集
低次假设集合是包含在高次假设集合中的。
![](https://img.haomeiwen.com/i8016875/4fa041fb00def11f.png)
![](https://img.haomeiwen.com/i8016875/6e999a405de552e3.png)
先线性模型,效果不好的话,再使用更高次的模型。
![](https://img.haomeiwen.com/i8016875/44ad2e21660bc716.png)