roadmap&资源-林轩田机器学习基石

2017-08-25 本文已影响356人 Sun_f

6、7月份，我在couresa上学习了台大林轩田老师的《机器学习基石》课程和吴恩达老师的《机器学习》课程。两门课都不错，林更注重基础，吴更注重实践，也更简单一些。

温故而知新，我近期打算将笔记重新整理一遍，笔记专辑地址为：林轩田机器学习基石笔记，不定期更新...

以下是提炼的主要思路：

1、什么是机器学习？

利用算法从数据中学习以提升预测能力。

2、什么时候会用到机器学习?

有足够多的数据；有一定的规律/目标/模式可以去学习；人很难去定义规则

3、为什么机器可以学习？

� 输入样本N足够大（根据霍夫丁不等式，有Ein=Eout）

� 好的假设空间（坏样本概率减小，演算法可以自由做选择，此时Ein=Eout）（好的假设空间会有一个突破点，其本身是有限的，并非人为所限制）

� 好的演算法（能够找出使Ein足够小的g，此时Ein=0）

4、机器怎样学习？

二分类算法：PLA/Pocket、Linear Regression、Logistic Regression。

当代价函数最小时，效果最好。

可以利用特征转换来减少欠拟合，利用正则化来减小过拟合，利用验证数据来检测Ein。

主要资源链接：

课程视频1、课程视频2