「经典课程」哈佛大学大数据算法(第一部分)
2018-01-02 本文已影响25人
智能观
哈佛大学的大数据算法(COMPSCI 229r)课程堪称经典,课程涵盖严格的方法,基于坚实的理论基础,处理海量数据。讨论的主题包括流和草图算法,降维和外部存储器算法等。
本课程讲师Jelani Nelson是哈佛大学的计算机科学系教授,John L. Loeb工程与应用科学副教授。
课程面向研究生和高级本科生,要求对算法、离散概率和线性代数等数学知识掌握成熟。
本文是该课程的第一部分,包括八节课,平均每节课1.5小时。
第一讲
物流,课程主题,基本尾界(马尔可夫,切比雪夫,切尔诺夫,伯恩斯坦),莫里斯的算法。
第二讲
不同的元素,k -wise独立性,流的几何子采样。
第三讲
随机/近似保证的必要性,线性草图,AMS草图, p稳定草图(0
第四讲
p稳定草图分析,Nisan的PRG,p大于2的最大稳定ℓp估计。
第五讲
ℓp估计算法的最大稳定性分析,基于非相干矩阵的确定性点查询(查询估计算法)。
第六讲
CountMin素描,点查询,重击者,稀疏近似。
第七讲
countsketch,ℓ 0采样,图标素描。
第八讲
遗忘动态规划(大约到单调性的距离)。
课程链接:https://pan.baidu.com/s/1dFLaRzN
—完—