「大数据机器学习」机器学习定义和典型应用
来源
大数据机器学习 --- 袁春老师
从学习强国观看总结
第一章 概述
一、大数据机器学习的背景知识
二、机器学习与相关学科的关系
三、机器学习发展历程
四、大数据机器学习的主要特征
五、课程参考书目
一、大数据机器学习的背景知识
1、第一个例子
「大数据机器学习」机器学习定义和典型应用请看这些图,这些图看似纷繁复杂,包罗万象,既有水井,又有家庭聚餐,也有孩子洗澡,还有瑜伽练习,可是,如果我们问,这些图可以归为哪一些类别呢?答案似乎也不容易回答?
「大数据机器学习」机器学习定义和典型应用然而,我们让计算机回答这个问题?正确的答案是什么呢?
那么,机器真的能回答吗?刚才的这个问题,以及这些图片,来自计算机视觉著名的比赛,ImageNet,是由斯坦福大学等高校共同创建的。
「大数据机器学习」机器学习定义和典型应用这个问题来自比赛中的图片分类任务,比赛还包括其他的任务,如物体检测定位,细粒度分类,场景分割等,去年开始增加了视频中的物体检测和分割等任务,ImageNet2012年的分类任务数据集有1000个类别,每个类别有1200张图片;细粒度分类任务包括120个总的类别,每个类别有200张图片。
「大数据机器学习」机器学习定义和典型应用我们来看一下,在比赛中,平均的错误率是多少,我们可以看到,2010年和2011年的错误率分别为28%和26%,然而,在2012年,错误率有了大幅度的提升,达到了16%,这背后的原因是什么呢?原因就在于卷积神经网络的采用,2012年,多伦多大学的hinton教授等提出的AlexNet卷积神经网络使得ImageNet分类任务的计算机性能有了质的飞跃!这是当年Alenx Hinton提出的AlexNet卷积神经网络模型!
「大数据机器学习」机器学习定义和典型应用 「大数据机器学习」机器学习定义和典型应用由于分类任务的类别数为1000,所以该模型的输出也是1000;
由于AlexNet在ImageNet分类任务上的突出表现,立刻引起了机器学习学术界的极大关注,无数科研人员被此吸引,投身其中,开始了深度学习方法的研究!
而产业界更是奋起直追,伴随而来的就是深度学习在学术界和产业界的飞速发展,从2012年,AlexNet之后,微软、谷歌以及一些高校相继提出了改进的卷积神经网络。
如,上面的图列举了这几年主要的卷积神经网络算法模型。其中2015年,微软提出的神经网络模型在分类任务中的错误率为4.94%,低于人类测试得到的5.1%,这标志着人工智能在图像识别技术上取得了根本性的突破。
当然,我们刚才提到的勺子的这个例子,它的错误率没有这么低,这里指的是拓扑的平均错误率。
2、第二个例子
「大数据机器学习」机器学习定义和典型应用我们知道,谷歌收购的DeepMind强化学习团队,在2016年3月,设计实现的AlphaGo战胜了人类围棋的世界冠军李世石,这标志着人工智能又一次取得了巨大的突破!
「大数据机器学习」机器学习定义和典型应用这幅图是AlphaGo背后取得成功的强大模型!
上述的这两个例子揭示了这样一个事实,机器学习进入了一个新的时代,我们称之为大数据机器学习时代!
3、机器学习的一般解释
维基百科
机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。
4、机器学习的实际应用例子
1)在游戏方面(Game)
「大数据机器学习」机器学习定义和典型应用1997年,IBM的深蓝战胜世界国际象棋大师卡斯帕罗夫,1997年版本的深蓝运算速度为每秒两亿步棋,是其1996年版本的两倍。
2)文音转换系统与语音识别系统(Text to speech and speech recognition)
「大数据机器学习」机器学习定义和典型应用文音转换系统与语音识别系统都是机器学习的传统应用领域,它们都在日常生活当中伴随着我们,或者是为残障人士提供便利!
3)3D体感游戏
「大数据机器学习」机器学习定义和典型应用3D体感游戏是机器学习与计算机视觉的结合,我们可以在家庭当中通过游戏锻炼身体,提高生活质量。
4)生物信息学(Bioinformatics)
「大数据机器学习」机器学习定义和典型应用机器学习在生物信息学中的作用尤为突出,例如,利用机器学习方法,可以找到我们所感兴趣的基因。我们可以从人类的染色体提取隔离的人类氨基酸序列,翻译成氨基酸序列。然后,在生物的蛋白模型的数据中找寻类似的序列,然后基于已知结构的相似蛋白,对人类蛋白结构进行建模,从而能够发现捆绑到已经建模蛋白的药物!
5)量化高频交易(Quantitative trading)
「大数据机器学习」机器学习定义和典型应用量化高频交易也是机器学习中的重要应用领域,越来越多的基金公司或商业机构,尝试利用深度学习方法预测行情走势,进行交易的决策和判断!
6)机器人、智能驾驶(Robotic Control)
「大数据机器学习」机器学习定义和典型应用机器人、智能驾驶也是机器学习中的重要应用领域,越来越多的公司开发相关的应用产品,在智能驾驶中,通过雷达获取的地面信息,通过计算机视觉技术进行分析,从而使得汽车可以自动规避障碍!
7)再现中国传统的陶瓷工艺
「大数据机器学习」机器学习定义和典型应用除此以外,机器学习还可以用于再现中国古代的陶瓷工艺,中华文化源远流长,优秀的陶瓷值作工艺已经失传,如何利用机器学习的方法学习模型在陶瓷制造的工艺条件,如陶瓷烧制为年度,瓷土原料,燃料特性,窑炉环境参数等数据,从而能够重现陶瓷工艺,再现中华文化的优秀作品!