机器学习和人工智能入门

我的机器学习之路V1.28

2017-03-13  本文已影响0人  刘开心_8a6c

2017.03.12

2017.03.13

2017.03.14

今天有一个项目需要找两组数据之间的关系,对于一个刚入门只会线性回归的菜鸟来说很棘手,遇到重重大山,今天一天分为磨刀和砍柴两部分,上午磨刀,主要读了官方文档的能实现线性函数的其他教程和API,通过不停地搜索实验,对昨天的手写识别又有了新的认识,对原理更加清晰了,下午砍柴,顺利地解决用pandas读csv格式数据后就一直在卡,示例太少了,只能自己摸索,结果跑出来一个几乎没有正确率的模型……停下来思考后发现可能是数据维度有问题,明天继续探索,加油!

2017.03.15

2017.03.16

今天研究了softmax regression,读的是ufldl教程,看英文比较吃力,因为好多数学专业术语,但是能明显发现英文教程的严谨。现在不光要补充计算机知识了,还得补充高数知识,有很多公式远离原理和意义都不是很清楚,所以对问题的认识比较浅,想要提炼论文的创新点,就必须对公式原理了如指掌。看了四天回归,只是机器学习的局部,这次的学习我忽略了一个大问题——我忘记列全部的提纲了,整个框架还不是很明确,各种方法的优点缺点还模棱两可,稍后就进行总结。

2017.03.17

2017.03.18

参加了12个小时的IBM power 编程马拉松, 要求实现遮挡脸部检测,虽然最后没有写完代码,但是收获颇多。

2017.03.19

今天是真的没有学什么,彻底地放松了一天,和好友看了场《美女与野兽》,感觉好棒,是时候写论文了,明天开始,加油

2017.03.20

今天学习了支持向量机和主成分分析。把算法过了一遍,用MNIST写了一个PCA的demo,但是疑问很多,对支持向量机的功用了解了,会用了,但是原理总觉得在云里雾里,对于改进这件事根本无从下手,好忧伤T.T

2017.03.21

今天最大的收获是搞懂了主成分分析,用MNIST数据集做了一个demo,由于内容太多还没有整理完,明天发,打算和线性回归结合,看看是否能提高精度。
今天找到了适合自己学习的路线:是什么,做什么,怎么用,效果怎么样,原理什么,有什么利弊。把原理放在了后面,因为我发现可视化意义可以提起对一件事的兴趣,通过它能干嘛,我能更好的理解原理,思考原理,这对我来说是一种很好接受知识的方式。

2017.03.22

2017.03.23

今天看了SVD,但是不是很懂,数学还是瓶颈,对昨天的协方差矩阵,求特征向量的具体求法还是不够透彻,要做点题了。

2017.03.24

今天心情很糟,什么都没做。。。

2017.03.25

为了处理昨天的事情,今天大部分时间都在路上,只看了一点python的基础知识。

2017.03.26

2017.03.27

今天一天都在看推荐算法,在ipad上找到了超好的画流程图的app,晚上回宿舍前画了一张,好有成就感,边画边理思路,哦对还看了皮尔逊相关系数的数学推导,越来越爱数学了。

2017.03.28

2017.03.29

今天一整天都在搞推荐实战,发现以下几个问题

大数据置0和荟文讨论出丢弃法,能快速置0。矩阵不好拼,代价太高,也不拼了,讨论出横向计算和纵向计算两种方式,明天都试试,我们两个人的思想融合一下应该就能有比较好的效果,还有一个思路,就是用卷积矩阵,还有相似度的不断维护上,总感觉有什么好的想法,明天实现完具体看。大数据量是个问题,值得好好研究,不知不觉快被引到分布式了。喜欢思想碰撞,总能有好多新思路,数学依然是短板,需要好好研究。

2017.03.30

今天一天都在写推荐论文,事情总是一执行就和猜想不一样,写起来才发现各种问题。

2017.03.31

终于写完了小论文的初稿,三天没做知识输出感觉好惭愧,争取明早发一波。加油。

2017.04.1-2017.04.04

长岛旅行。

2017.04.05

一趟旅游似乎规律被打乱了,时间如白驹过隙,一转眼十天就过去了,论文也没写,实验也没做,想想接下来面临的事就觉得一团乱麻,明明计划好了,怎么感觉玩了一趟懵逼了,还是记录做的不到位,时间没有规划好。今天只做了改论文一件事,说是修改,感觉重新写了一遍,还有一部分,明天写吧。

2017.04.06

今天一天都在奋笔疾书,修改论文,一直在考虑如何表述的更清楚,看了自己前几天写的简书,发现长篇大论却依然没有表达清楚意思,有的问题能够说的清楚,但是落在笔上就完全变了意思,所以写作的功底还需要练习,希望通过这次的论文能提高表达能力。

2017.04.07

终于完成了小论文,迎面而来的还有七千字的大论文,半个月没有知识输出了,感觉好空虚,好像时间喂了狗,整个人都不好了。。。

2017.04.08

今天做的最重大的决定就是将自己从前几天的空虚中拯救出来,为了寻求刺激感,也为了给老爸省钱,决定用仅剩的10天学完优达学城机器学习纳米工程师课程,这是个极大的挑战,因为本是一年的课程,可能很少有人能十天内完成,但是也只有这件事让我想起来就满血复活,所以我决定用这样的方式给自己充电,唤醒身体。

下午六点到实验室,开始着手写基于协同过滤的推荐算法实战部分,中间有一个小时左右的时间给同学在实验室办了一个小party,其余时间都在写,直到十点半回宿舍,还有一个小尾巴,决定明早完成。

2017.04.09

2017.04.10

8:00 - 9:48 完成北京房价预测选做题。果然用起来就会了,发现对交叉验证和网络搜索似乎有了更深的认识。接下来有两个选择,继续做项目还是停下来看补充整理的知识。我选择后者,稳步前进。
10:10 - 11:40 听波士顿房价预测项目的视频
13:30 - 14:00 听波士顿房价预测项目的视频
14:40 - 15:00 听完了波士顿房价预测项目的视频,发现做项目时候遇到的问题配套视频中都有讲解,下一个项目我决定先以现有的知识做,卡住的到视频里听一下,做完后不提交,把视频听完,根据感想和新学的知识再做一遍项目,巩固所学。到目前为止,最大的收获就是知道了一个问题从开始的分析到后面的建模到最后测试验证的全部流程,是一个很重要的框架。

2017.04.11

机器学习项目流程和模型评估验证
7:10 到实验室,做了一组唤醒身体的动作
8:00 开始第三次修改项目 这一次终于弄懂了网格搜索和交叉验证 彻底懂了 很感谢reviewer的严厉和指点
后面的时间都在改论文。。。
晚上总结回顾了所学

2017.4.12

今天看了一部分P2,很想快点做完和小波老师一起探讨,没想到下午就开始改论文……又要重新写一遍了。

2017.4.13 - 2017.4.14

要写论文写吐了T.T

2017.4.15

今天最大的收获就是参加了高校物联网竞赛的答辩,听Aws的博士讲当今科技,如果不是今天,我的眼界还局限在埋头钻研,最可怕的就是闭门造车。学会站在巨人的肩膀,眺望远方的同时学会如何长高。

2017.4.16

今天终于小论文第三版搞定,明天可以安心学习udacity了。

2018.4.17

时隔一年,很巧合,日期刚好拼接起来。接触机器学习已经整整一年了。一路跟着udacity的脚步,拿下了机器学习工程师纳米学位,收获还是很大的,尤其在解决问题的思维上,感觉真正入行的一个项目就是udacity的毕设项目,我选择的是kaggle两年前的一个比赛——侦测走神司机,这个项目的最低要求是达到top10%,也就是拿到铜牌。这是个很好的开始,我花了三个月的时间终于到了铜牌垫底,这是我第一次垫底还这么开心,我决定把这个项目当做研究生毕设项目,一直做到top10。

上一篇 下一篇

猜你喜欢

热点阅读