奇异值分解SVD

2021-06-07  本文已影响0人  ltochange

定义

矩阵的奇异值分解(SVD)是指,将一个非零的 m \times n 实矩阵 A, A \in{R}^{m \times n}, 表示为三个实矩阵相乘的形式:
A=U \Sigma V^{\mathrm{T}}
其中,Um 阶正交矩阵, Vn 阶正交矩阵,\Sigma 是由降序排列的非负的对角线元素组成的 m \times n 矩形对角矩阵, 满足

\begin{aligned} &U U^{{T}}=I \\ &V V^{{T}}=I \\ &\Sigma=\operatorname{diag}\left(\sigma_{1}, \sigma_{2}, \cdots, \sigma_{p}\right) \\ &\sigma_{1} \geqslant \sigma_{2} \geqslant \cdots \geqslant \sigma_{p} \geqslant 0 \\ &p=\min (m, n) \end{aligned}

\sigma_{i}成称为矩阵A的奇异值,U的列向量称为左奇异向量,V的列向量称为右奇异向量

ps:奇异值分解不要求矩阵A是方阵,矩阵的奇异值分解可以看作是方阵对角化的推广

常用形式

以上给出的奇异值分解又称为完全奇异值分解,实际常用的是奇异值分解的紧凑形式和截断形式。

设有m \times n 实矩阵 A, 其秩为 \operatorname{rank}(A)=r, r \leqslant \min (m, n):

紧奇异值分解:
A=U_{r} \Sigma_{r} V_{r}^{\mathrm{T}}

其中,U_{r}m \times r 矩阵, V_{r}n \times r 矩阵, \Sigma_{r}r 阶对角矩阵;矩阵 U_{r} 由完全奇异值分解中 U 的前 r 列、矩阵 V_{r}V 的前 r 列、矩阵\Sigma_{r}\Sigma 的前 r 个对角线元素组成。紧奇异值分解的对角矩阵 \Sigma_{r} 的秩与原始矩阵 A 的秩相等。

截断奇异值分解

A \approx U_{k} \Sigma_{k} V_{k}^{\mathrm{T}}

其中,0<k<rU_{k}m \times k 矩阵, V_{k}n \times k 矩阵, \Sigma_{k}k 阶对角矩阵; 矩阵 U_{k} 由完全奇异值分解中 U 的前 k 列矩阵 V_{k}V 的前 k 列、矩阵 \Sigma_{k}\Sigma 的前 k 个对角线元素组成。对角矩阵\Sigma_{k}的秩比原始矩阵A 的秩低

性质

(1)设矩阵 A 的奇异值分解为 A=U \Sigma V^{\mathrm{T}}, 则以下关系成立:
\begin{aligned} &A^{\mathrm{T}} A=\left(U \Sigma V^{\mathrm{T}}\right)^{\mathrm{T}}\left(U \Sigma V^{\mathrm{T}}\right)=V\left(\Sigma^{\mathrm{T}} \Sigma\right) V^{\mathrm{T}} \\ &A A^{\mathrm{T}}=\left(U \Sigma V^{\mathrm{T}}\right)\left(U \Sigma V^{\mathrm{T}}\right)^{\mathrm{T}}=U\left(\Sigma \Sigma^{\mathrm{T}}\right) U^{\mathrm{T}} \end{aligned}

(2)矩阵A的奇异值分解中,左奇异向量,右奇异向量和奇异值存在一一对应的关系

(3)矩阵 A 的奇异值分解中,奇异值 \sigma_{1}, \sigma_{2}, \cdots, \sigma_{n} 是唯一的,而矩阵 UV 不 是唯一的。

(4)矩阵 A\Sigma 的秩相等, 等于正奇异值 \sigma_{i} 的个数 r( 包含重复的奇异值,奇异值都是非负的)

(5)矩阵 Ar 个右奇异向量 v_{1}, v_{2}, \cdots, v_{r} 构成 A^{\mathrm{T}} 的值域 R\left(A^{\mathrm{T}}\right) 的一组标准正交基

几何解释

从线性变换的角度理解奇异值分解:

m \times n 矩阵A 表示从 n 维空间 \mathbf{R}^{n}m 维 空间 \mathbf{R}^{m} 的一个线性变换,
T: x \rightarrow A x
x \in {R}^{n}, A x \in \mathbf{R}^{m}, xA x 分别是各自空间的向量。

A=U \Sigma V^{\mathrm{T}} 奇异值分解可以看作, 将线性变换A转换为三个简单变换. 例如下图, 给出了原始空间的标准正交基 (红色与黄色),经过坐标系的旋转变换 V^{\mathrm{T}} 、坐标轴的缩放变换 \Sigma, 坐标系的旋转变换 U ,得到和经过线性变换 A 等价的结果。

在这里插入图片描述
上一篇下一篇

猜你喜欢

热点阅读