roadmap&资源-林轩田机器学习基石
2017-08-25 本文已影响356人
Sun_f
6、7月份,我在couresa上学习了台大林轩田老师的《机器学习基石》课程和吴恩达老师的《机器学习》课程。两门课都不错,林更注重基础,吴更注重实践,也更简单一些。
温故而知新,我近期打算将笔记重新整理一遍,笔记专辑地址为:林轩田机器学习基石笔记,不定期更新...
以下是提炼的主要思路:
1、什么是机器学习?
利用 算法 从 数据 中学习以 提升预测能力。
2、什么时候会用到机器学习?
有足够多的数据;有一定的规律/目标/模式 可以去学习;人很难去定义规则
3、为什么机器可以学习?
� 输入样本N足够大(根据霍夫丁不等式,有Ein=Eout)
� 好的假设空间(坏样本概率减小,演算法可以自由做选择,此时Ein=Eout)(好的假设空间会有一个突破点,其本身是有限的,并非人为所限制)
� 好的演算法(能够找出使Ein足够小的g,此时Ein=0)
4、机器怎样学习?
二分类算法:PLA/Pocket、Linear Regression、Logistic Regression。
当代价函数最小时,效果最好。
可以利用特征转换来减少欠拟合,利用正则化来减小过拟合,利用验证数据来检测Ein。
主要资源链接: