2021-02-24主成分分析(pac)
简单的梳理一下 昨天的学习过程 以及罗列一下 晚上要讲的西瓜书的第十章的三四节
决策与判断 看到了第六章了 但是慢慢的对 笨蛋重要的是逻辑 产生了一丝丝的感悟 它更偏重的是对一个点的 全面描述 通过三段式的推理 从圈子的各个方面对其 分析 推到的正确与错误 还有一个要自己再思考思考 为什么自己没有读下去 难道仅仅是 自己与作者的段位不匹配 又或者 太枯燥 通过的一个方式 还是多读几本书 回头看看能看下的书籍 与 不太能看下去的书籍的不同之处 或者看看不太能看下去的书籍的相似之处 看书的影响 真的感觉到了 一丝丝的如沐春风的感觉 自己的一个感觉看书的过程中 无形中在思考 相当于每天的进食 影响几乎是微小的 是一件极其缓慢的事情 看的过程中 无形的在思考 我是谁 我要到哪里去 对自己的一个探究过程
主成分分析 一种线性降维的方法 针对的是线性可分的数据 如果数据不可分 采用核化线性降维 先对数据做一个高维映射 使得数据线性可分 再用PAC进行降维 说明了讲个区别 接下来就是着重介绍PAC主成分分析 是西瓜书上的数学公式 是极其抽象的 我的学习 是通过 知乎 与B站 进行检索学习 一个是 视频 一个是 文字 各有优缺点 看自己的一个接受程度的偏好 个人的一个看法 文字带来的印象感觉更加深刻一点点 通过书上前面引用的k近邻算法 说明了降维的必要性 减少数据的特征的相关性
找到数据最本着的特征 或者说影响数据最大的特征 (本质的学习) 学习的文章是知乎马同学讲的PAC 先从一个简单的例子 说明降维一个简单的过程是怎样的 由简单的相关系数为一的简单的例子开始 接着引入一个相关系数不为一的二维的例子 讲解降维的过程 现在让自己为难的点是 如何把书上的极其简单的公式 与 实际的例子相结合的讲述 大致的一个讲述过程 就是 先介绍马同学的文章 接着开始介绍书上的例子 再来回的一个对比过程中 终于是理解到了 其中涉及的一个思想
先是通过一个基本的过程 来说明降维的过程 推导出最后的一个式子 与 样本的协方差矩阵 的奇异分解类似 所以最终通过样本的协方差矩阵 来计算最终的降维坐标