矩阵论-lecture 6-LS
ENGG5781 矩阵分析和计算
第 6 课:重新审视最小二乘法
马永健
2020–2021 第一学期
电子工程系
香港中文大学
第 6 课:重新审视最小二乘法
- 第一部分:正则化
- 第二部分:稀疏性
1) 最小化
2)贪婪的追求, 最小化,和变化
3)用于 最小化的凸优化(majorization-minimization)
4)字典学习 - 第三部分:LS 在 A 中的错误
– LS整体
– 稳健的 LS,及其与正则化的等价
第一部分:正则化
对噪音的敏感性
- 问题:当有噪声时,LS 解决方案的灵敏度如何?
- 模型:
其中 是真实结果; 具有完整的列秩; 是噪声,建模作为具有均值零和协方差 γ 的随机向量 . - 均方误差 (MSE) 分析: 根据 我们可以得到
- 观察:如果某些 接近于零,则 MSE 变得非常大。
玩具演示:曲线拟合
image.png与第 2 课中的曲线拟合示例相同。“真实”曲线是模型阶数 n = 4 的真实 f(x)。实际上,模型阶数可能未知,我们可能不得不猜测。 上面的拟合曲线由 LS 完成,猜测的模型阶数为 n = 16。
-正则化 LS
- 直觉:替换 by
对于某些 , 添加项 以改善系统调节,从而尝试降低噪声敏感性。 - 我们如何理解这样的修改?
-
-正则化 LS: 找到一个可以解决的
对于某些预先确定的 . - 解决方案是唯一给出的
- 公式说我们试图最小化两者 和, 和 控制在最小化中应该更强调哪一个
拟合曲线由-正则化 LS 完成,猜测模型阶数为 n = 18,λ = 0.1。
第二部分:稀疏性
稀疏恢复问题
问题:给定 , ,m<n,找一个最稀疏的 ,使得y = Ax。
image.png最稀疏,我们的意思是 x 应该有尽可能多的零元素。
稀疏优化公式
- 让
表示基数函数 - 通常称为" 规范", 尽管它不是规范。
- 最小 范数公式:
- 问题:假设 , 其中 是我们寻求恢复的向量。 可以最小。 规范 问题以精确和独特的方式恢复 。
- 答案在于火花的概念,它可以被视为对秩的强定义
火花
火花:的火花,用 表示,是 的最小线性相关列数。
-
令. 则 是最小的数,使得存在线性相关的 ,其中 .
-
令 . 那么 对于任何
-
简单地说, 的 列的任何集合都是线性无关的。
-
与秩比较: 令 (与上面的 不同). 那么,对于某些 ,存在线性无关的
-
Kruskal 秩: 这是等级的另一种定义。T,的克鲁斯卡尔秩,用表示,其定义等价于 。
-
如果 属于 , with ,线性无关, 那么
-
一个例子是具有不同根的范德蒙德矩阵
-
一些专门设计的基地也有这个属性
-
但也存在排名和火花非常不同的情况
-
令 线性无关,令 .
-
我们有 ,但是
-
总而言之,spark 可以被视为对等级的更强定义,并且
最小的完美恢复保证- 范数问题
定理 6.1。 假设 。那么, 是最小 范数问题的唯一解,
- 含义:如果 足够稀疏,那么最小 范数问题完美地恢复了
- 证明草图:
- 让 成为 范数问题。 令 .
- 。
- 假设。然后,
最小的完美恢复保证。 范数问题
相干性: 的相干性定义为
- 衡量 的列在最坏情况下的相似程度。
定理 6.1 的弱版本:
推论 6.1。 假设 。 那么, 是最小 范数问题的唯一解,如果
- 含义:完美的恢复可能取决于 的不连贯程度。
- 证明思路:证明
关于求解最小范数问题
问题:我们应该如何解决最小 范数问题
还是可以有效解决?
- 范数最小化不会像 2 范数那样产生简单的解决方案。
- 最小的 范数问题通常是 NP-hard。
- 这意味着什么?
- 给定任何 ,该问题不太可能在多项式时间内完全解决(即,复杂性为 对于任何 )
暴力搜索最小值 范数问题
- 符号: 表示 的子矩阵,通过保留 指示的列获得
- 我们可以通过蛮力搜索解决 范数最小化问题:
输入:
对于所有 做
如果 有一些
记录 作为候选解决方案之一
输出: 一个候选解 其中 是最小的
- 例如:对于 ,我们测试
- 可以用非常小的 来管理,即使是中等 也太贵了
- 搜索较少的贪婪搜索怎么样?
贪婪的追求
- 考虑称为正交匹配追踪 (OMP) 的贪婪搜索
算法: OMP
输入:
set
repeat
直到满足停止规则,例如 足够小
输出:
- 注意:还有许多其他贪婪搜索策略
贪婪追击的完美恢复保障
- 再次,一个关键问题是 OMP 承认完全恢复的条件
- 有很多这样的理论条件,不仅对于OMP,对于其他贪婪算法也有
- 一个这样的结果如下:
定理 6.2。 假设 。 然后,OMP 恢复 如果
- 证明思路:证明 OMP 保证在每个阶段选择正确的列。
凸面收缩
另一种近似方法是将 替换为凸函数:
- 在文献中也称为基础追求
- 凸,线性规划
- 没有封闭形式的解决方案(而最小 2 范数问题有)
- 但是这个最小 1 范数问题在理论和实践中的成功激发了大量的计算效率算法的工作
1-范数几何图解
image.png- 图 A 显示了 中半径为 的 1-范数球。 请注意,1 范数球沿轴是“尖的”。
- 图 B 显示了 1-范数恢复解决方案。 点 是一个“稀疏”向量; 行 是所有满足 的 的集合。
1-范数几何图解
image.png- 1-范数恢复问题是在 中挑出一个具有最小 1-范数的点。 我们可以看到 就是这样一个点。
- 图 C 显示了使用 2 范数时的几何形状。 我们可以看到解 可能不是稀疏的。
最小的完美恢复保证。 1-范数问题
- 再次,研究人员研究了最小 1-范数问题允许完美恢复的条件
- 这是一个令人兴奋的话题,具有许多可证明的条件,例如受限等距特性 (RIP)、零空间特性 (NSP)、...
- 有关详细信息,请参阅文献,这里有一个:[Yin'13]
- 一个简单的如下:
定理 6.3。 假设 。 那么, 是最小 1-范数问题的唯一解,如果
玩具演示:稀疏信号重建
- 稀疏向量 其中 和 。
- 是随机生成的。
应用:压缩传感 (CS)
- 考虑一个信号 具有稀疏表示 in (例如 DCT 或小波)的域,即,
其中 是稀疏的。
左:原始图像 。 右:小波域中对应的系数,是稀疏的。 资料来源:[Romberg-Wakin'07]
应用:CS
- 为了获得 ,我们使用感知矩阵 来观察
在这里,我们有 ,即比 no 少得多的观察值。 未知数 - 这样的 y 将有利于压缩、传输和存储。
-
通过恢复 来恢复:
其中 - 如何选择 ? CS 研究表明 i.i.d. 随机 会很好用!
变化
- 当 被噪音污染时,或者当 不完全成立时,前一分钟的一些变体。 可以考虑使用 1范数公式:
- 基础追求去噪:给定 ,求解
-
-regularized LS:给定,求解
- 套索:给定 ,求解
- 当 中存在异常值时(即 的某些元素严重损坏),我们还希望残差 是稀疏的; 所以,