从Python到机器学习——我的学习路线
欢迎关注微信号:student_Shang
小编是985院校小硕士一枚,欢迎关注,持续更新中~
哈喽,大家好~
首先要跟各位说声抱歉,因为刚开学一些个人琐事比较多,导致公众号处于长期断更的状态。很感谢各位朋友并未取关,小尚童鞋在这里跟大家说声谢谢啦!以后的更新应该会慢慢加快频率,甚至实现一天一更的状态。
先简单回顾一下上个月的学习情况:除了每周相对较多的随机过程以及工程矩阵作业之外,剩余的时间大多用在 Python 的学习与应用上,这其中包括对 Python 语言特性的学习,也包括利用 Python 实现简单的爬虫应用,这主要通过 Python 中丰富多样的第三方库完成,例如 Requests 库(请求网页)、BeautifulSoup 库(解析网页)、 re 库(解析网页)等。想在这里立一个 flag :每天更新一个爬虫程序,持续一个月。当然啦,如果发现我当天没有更新,可以在当天 12 点以后公众号告诉我,我会在第二天的推送中选择一位发个小红包(10-20 元)~
今天写这篇推送的目的第一是跟大家说一声,我胡汉三又回来了 hhh~;第二呢,就是打算从今天开始转入机器学习算法的理论学习中,关于 Python 内容会慢慢更新。接下来根据自己对周志华教授《机器学习》这本书第一章的阅读进行一个简单的总结。
1 导入
其实本质上来说,“机器学习”这一概念并不新鲜。我们可以把他看做“新瓶装旧酒”的一个典型。你可能会问,为什么近些年突然这么火来了。
周老板在第一章中是这么解释的
数据大了,计算能力强了
在过去,之所以没有发展起“机器学习”,本质上便是因为当时的硬件设备难以满足要求,而近些年随着摩尔定律的迭代,包括“智能手机”的出现,不仅计算能力与过去发生了翻天覆地的变化,同时无穷无尽的数据散布在互联网的各个角落。这才导致“机器学习”这把火越烧越旺。
2 机器学习中的一些问题
2.1 机器学习的研究内容
本质上说,机器学习的研究内容便是完成对一组数据的分析,这必然会涉及到相关算法,例如监督学习(Supervised Learning)、无监督学习(Unsupervised Learning)等,这些算法被统称为“学习算法(Learning Algorithm)”。
2.2 机器学习的特点
总的来说,机器学习的特点主要包括下述几点:
-
机器学习是以概率论、统计学、信息论、计算理论、最优化以及计算机科学等多领域交叉的学科;
-
机器学习以模型方法为中心,运用统计学习方法建立相应模型,随后利用这一模型完成对未知数据的预测;
-
机器学习的目的便是为了对数据进行更好的利用;
-
机器学习算法主要以数据的特征作为依据,是数据驱动的科学。
2.3 机器学习的全过程
输入数据 -> 算法建模 -> 对未知数据再预测
从这一流程可以看出,数据是关键,没有数据便没有机器学习。第二便是针对具体问题,利用已知算法,完成建模任务,这其中包括归纳偏好、评估方法、性能度量、比较检验等。在模型不断更新的基础上,我们实现了对未知数据更好的预测。
3 再谈人工智能、机器学习与深度学习
上世纪五十年代开始,人工智能(Artificial Intelligence)便处于研究阶段,那时科学家认为,只要机器能够具备逻辑推理能力,便能够具有智能。当然,这一理论已经被推翻。随后人们想到,由人把规则告诉机器,让机器来进行处理,这一阶段出现了“专家系统”,但是也无法解决这个世纪性难题。再然后科学家们便想到,我们可以让机器自己去学习呀~这便是机器学习的由来。而我们这里提及的深度学习,也便是上世纪出现的多层神经网络。
4 总结
机器学习首先需要数据作为支撑,随后针对具体问题,选择合适的算法完成建模,根据一系列指标对模型进行评价,并不断优化,在优化的过程中做到对数据进行更好的分析与预测。
THE END