(十二)LLE局部线性嵌入降维算法

2018-12-27  本文已影响0人  躺在稻田里的小白菜

一. 前言

1. LLE

局部线性嵌入(Locally Linear Embedding,以下简称LLE)是非常重要的降维方法。和传统的PCA,LDA等关注样本方差的降维方法相比,LLE关注于降维时保持样本局部的线性特征(保持原有拓扑结构),由于LLE在降维时保持了样本的局部特征,它广泛的用于图像识别,高维数据可视化等领域。LLE是非线性降维技术,可以说是流形学习方法最经典的算法之一。很多后续的流形学习、降维方法都与LLE有密切联系。
但是LLE在有些情况下也并不适用,如果数据分布在整个封闭的球面上,LLE则不能将它映射到二维空间,且不能保持原有的数据流形。那么我们在处理数据中,首先假设数据不是分布在闭合的球面或者椭球面上。

LLE降维
2. 流形学习

传统的机器学习方法中,数据点和数据点之间的距离和映射函数都是定义在欧式空间中的,然而在实际情况中,这些数据点可能不是分布在欧式空间中的(比如黎曼空间),因此传统欧式空间的度量难以用于真实世界的非线性数据,从而需要对数据的分布引入新的假设。

二. LLE算法

LLE算法认为每一个数据点都可以由其近邻点的线性加权组合构造得到。算法的主要步骤分为三步:

  1. 寻找每个样本点的k个近邻点;
    流形学习的局部区域具有欧式空间的性质,那么在LLE中就假设某个点xi坐标可以由它周围的K个点的坐标线性组合求出。这个K是人为设定的,具体情况具体分析。需要注意,当k取值较小时,算法不能将数据很好地映射到低维空间,因为当近邻个数太少时,不能很好地反映数据的拓扑结构;但若k取值太大,不同类型的数据开始相互重叠,说明选取的近邻个数太多则不能反映数据的流形信息

  2. 由每个样本点的近邻点计算出该样本点的局部重建权值矩阵;

  3. 由该样本点的局部重建权值矩阵和其近邻点计算出该样本点的输出值。

具体推导参考这个大佬的文章:写的很细致。
https://www.cnblogs.com/pinard/p/6266408.html




参考:
https://blog.csdn.net/qq_16234613/article/details/79689681

上一篇 下一篇

猜你喜欢

热点阅读