降维方法综述

2019-05-29  本文已影响0人  长安逸魂

首先要明白,降维往往是为了在降低计算量的同时,尽量保持原来样本的分布

PCA

对于正交属性空间中的样本点,用超平面对样本进行表达需要满足最近重构性最大可分性

理论基础

伪代码

% INPUT: 样本集D={x_1,x_2,...x_m}; 低维空间维数 d' 
对所有样本进行中心化
计算协方差矩阵 XX^T
对协方差阵进行特征值分解
取最大的d'个特征值所对应的特征向量 w_1,w_2,...w_d'

多维缩放(MDS)

理论基础

伪代码

% INPUT: 距离矩阵D,其元素为dist_{ij}为x_i到x_j的距离;低维空间的维数$d'$
计算dist_{i.},dist_{.j},dist_{..}
计算B
对B进行特征值分解
取\lambda中前d'个最大特征值和对应的特征向量矩阵V
输出: V\lambda^{0.5}

参考自 周志华 《机器学习》

上一篇 下一篇

猜你喜欢

热点阅读