2018-11-27 机器学习打卡
课1 为什么学习公式:
选特征、调超参、换模型,称为调参工程师的三板斧,要想有章法地使用它们,理论基础还是必不可少的。
核心工作:工作就是在限定的数据上、规定时间内,为具体技术需求(比如训练一个分类器)提供性能尽量高、消耗资源尽量少的模型。
真正创造价值的,从来都是解决实际问题的人。
到了这一步,即使还使用现成工具,也不是靠 Google 一下 Best Practice,以及复制粘贴下代码就能解决的了。必须具备理论基础和数学层面的建模能力才行。
课2 改变看世界的方式:
有助提升逻辑,更深层次和更奇特的角度看待事物、认识人性和人脑的判断。
课3 如何学习
以模型为驱动去学习。
经典模型例如:线性回归、逻辑回归、决策树、支持向量机、条件随机场、K 均值等,就是机器学习的“肌肉”。
多学几遍,内化了解。
数学的基本要求:函数、向量和矩阵、求导、求微与函数的关系、最简单的矩阵运算。
日常Tips:关联思考,记录整理,互相分享
课4 Python学习(练习未完成)
python 2截止到2020年不被支持,趁早学python 3。
练习demo 这个一定要花时间去实现一下:
编写第一个 Python 程序:“Hello world”。虽然有效代码只有:print(”hello world”)。但注意,你需要尝试至少三种不同的运行方法:在命令行直接运行;编写一个 Python 文件,将 print hello world 封装为一个函数,通过 main 函数调用它来运行;编写一个 class,将 print hello world 封装为一个 method,通过 main 函数创建 class 实例来运行 method。(3)编写一个或者多个复杂点的程序,用(2)中第2种或第3种方式执行。具体程序的功能可以自己定义,目的是借此了解下面这些概念:数据类型、变量、函数、参数、返回值、调用、递归……学习流程控制:顺序、条件、循环。搞清几种不同类型:array、list、dict、set 的用法。在这个过程中,学习什么是静态类型、什么是动态类型、什么是强类型、什么是弱类型,这些不同设计的目的和应用场景分别是什么。如果你实在不知道写什么程序好,那就写写 binary search 和 quick sorting 吧。并顺便尝试一下递归和非递归的不同实现。
以及文件读写操作,测试如 Logistic Regression模型。
第8项也提的太简单了,自己实现算法到底要怎么做,感觉没法下手