First Try:机器学习应用及其理论分类

2018-12-31  本文已影响0人  贝_0f41

前段时间花69元购买了“吴恩达《机器学习》作业班”的资料,昨天刚开课,开课第一节的“开营仪式”的语音直播中首先强调了要整理笔记,要输出,否则时间久了就忘记了,这是一个整理学习的过程,所以我就来到了这里,希望自己也能慢慢养成这样一个习惯,在不断的总结中进步。

s2机器学习绪论

p1.机器学习中比较活跃的四大应用领域

️数据挖掘:发掘数据之间的关系

️计算机视觉:像人一样看懂世界

️自然语言处理:像人一样看懂文字

️机器决策:像人一样决策

p2.案例1:血糖值的预测

回归问题

已知:如表格中,共5643个样本,每个样本是一个人的体检的信息。

求:一个数学函数f,使其f(一个人的性别,年龄,总蛋白……淋巴细胞)=一个人的血糖值

这是一个回归问题,因为血糖值是连续的小数

p3.案例2:有无糖尿病的预测

分类问题

已知:如表格所示,共1000个样本,每个样本是人的体检检查的信息

求:一个数学函数f ,使其f(snp1,身高,bmi分类……snpss)=一个人是否患有糖尿病

分类问题:输出是离散值,代表属于哪类问题

p4.机器学习相关问题

机器学习两大基本问题:

️回归问题

️分类问题

什么是机器学习?

根据已知的数据,学习出一个数学函数f(x1,x2,x3,……xn)=y,使其能够有更强的预测能力

一些专有名词的概念:

️①机器学习模型:f

②features

️③label

️④样本

️⑤数据集

p5.计算机视觉的案例

案例3:图像分类

已知:如图所示,为一些示例样本

求:一个机器学习模型f,使其

原始图像  输入  机器学习模型  输出  类别

最近比较火的微信小程序:猜画小歌(刚刚体验了,真的很不错)

样本通常为上万个样本

p6:目标检测

已知:如图所示,为2个示例样本

求:一个机器学习模型f,使其  原始图像    输入    机器学习模型    输出  label

比较典型的应用:无人驾驶

让机器能够检测出一张图片中的所有物体,并能够判断出每个物体所属哪个类别,并且能够计算出物体在图片中的坐标信息

如图中,无人车的目标检测,无人车检测出图片中所有车辆,用红色框出所有小汽车,用蓝色框出所有大卡车

label 更为复杂,(20,60,50,80,4),前四个为坐标信息,最后一个为类别信息

数据集是人工一张一张的标注的,是庞大的工作,由庞大的机构进行后公开,供全球学者使用

p7:语音分割

已知:如图为3个示例样本

本质上来讲仍然是分类问题,即对每个像素点进行分类f([x_{i},y_{i}  ])=y   ([x_{i},y_{i}  ]表示第i个像素点)

求:一个机器学习模型f,使其    原始图像    输入    机器学习模型    输出    label

目标检测用检测框框出来的物体,不仅包括自身信息,还物体周围的信息也被标注在检测框内

语义分割更为精确,仅仅分割出自身的信息

如图中,马吃草经过语音分割后变成右侧,不包含周围信息

数据集依旧是人工标注的

p8:场景理解

左边为原始图片,右侧为切割好的图片

无人车可以根据显示的信息对图片进行分割,紫色的为汽车,粉色的物体表示道路,红色表示高楼,无人车可以根据此规划出可行的区域来

自然语音处理案例

p9:案例7 文本分类(例如新闻分类,体育?政治?科技……)

一篇新闻    输入    机器学习模型    输出    类别

案例8: 自动生产文本摘要

一篇文章    输入    机器学习模型    输出    摘要

案例9:翻译

一句英文    输入    机器学习模型    输出    一句中文

p10: 案例10:问答

已知:如图所示,为一个实例样本

求出:一个机器学习模型,使其

p11:微软小冰

一句话    输入    机器学习模型    输出    一句话 

如机器人聊天客服,微软小冰公众号

p12: image to text

已知:如下图所示,共4个实例样本

求出:一个机器学习模型f,使其

image    输入    机器学习模型    输出    text

根据图形自动输出一段描述图形的文本,文字与图片相一致,需大量人工标注

p13机器人决策案例

案例13:end to end 级自动驾驶

已知:如图所示,为2个示例样本

求:一个机器学习模型f,使其    相机    一张图片    机器学习模型    控制信号    车辆

传统的无人驾驶:相机和雷达采集车周围的信息,然后计算机对其进行三维建模等 ,然后根据建好的模型进行路径规划,最终产生控制信号控制车辆,总共有3个步骤:感知环境——路径规划——控制信号

而end to end 控制(端到端无人驾驶):没有传统的环境感知和路径规划的步骤

图为nvdia2016年的研究

进过大量的人力物力搜集样本,根据机器学习的算法输出模型

p15:案例14:玩赛车游戏

已知:如图所示,为torcs平台,一个赛车游戏(选手不是真实玩家,而是机器人(计算机程序)),也是一个无人驾驶的仿真环境,可以模拟一些实际场景,可以对车辆进行控制,比如向上换挡/向下换挡/加速/减速/向左打方向盘/向右打方向盘等,使其完成一次动作,比如车辆跟随,换道,超车,沿道路行驶等

世界各国的人们都会尝试开发一个程序去玩这个游戏

求出:一个机器学习模型f(通常将其称为agent),使agent像人一样,具有决策能力,能够控制这个赛车取得游戏中的最好成绩

agent 玩赛车的过程:

dota2 机器人挑战职业玩家

p16:案例15:机器人开门

已知:如图所示,为一个机器人开门的模拟环境和一个真实环境

求出:一个机器学习模型f(通常称为agent),使机器人能够根据摄像头采集到的信息,输出控制指令,对手臂进行控制,进而完成开门这一任务

agent开门的过程:

在仿真环境中进行大量学习训练得出基础模型,然后从真实环境中进行少量训练,对基础模型微微调整,以使其能够更好的从仿真环境迁移到真实环境中

p17:机器学习理论分类

根据上述案例所用到的知识理论,将机器学习理论主要分为以下3大部分:

注:上述3大理论只是机器学习中最为常用最为活跃的部分,当然严格意义上来讲,机器学习还包括其他方面的理论,只是不常用

每个应用案例用到了哪些相关理论知识:

传统的监督学习/深度学习:案例1血糖值预测和案例2有无糖尿病预测

深度学习:自然语音处理所有案例,计算机视觉所有案例和案例13end to end级无人驾驶

深度学习+强化学习:案例14玩赛车游戏,案例15机器人开门

注:在自然语言处理领域/计算机视觉领域,过去常常用传统的监督学习算法,但现在在很多任务上深度学习的效果更好,但是也有一部分任务上传统的监督学习算法更好。

p18 总结

建议路线:传统的监督算法——深度学习——强化学习

建议准则:循序渐进,慢慢来,一开始不要试图看懂一本书或一套视频的所有知识点

总的来说:这篇文章是边听视频边抄下来的,虽然不是自己编写的内容,可是还是成就感满满,毕竟对我一个还没有入门的小白来说,一开始就是要认真记录,消化吸收,时间久了自然能够输出自己整理的内容,加油!

上一篇下一篇

猜你喜欢

热点阅读