深度学习讲稿(4)
第2章: 基本概念
本章主要内容:
- 什么是深度学习、机器学习和人工智能?
- 什么是参数模型和非参数模型?
- 什么是监督学习和无监督学习?
- 机器如何学习?
2.1 什么是深度学习?
深度学习是机器学习方法的一个子集。
深度学习是机器学习的一个子集,机器学习是一个专门研究和开发能够学习的机器的研究领域(它的最终目标是获得通用人工智能)。
在业内,深度学习被用于解决多个领域的实际任务,如计算机视觉(图像)、自然语言处理(文本)和自动语音识别(音频)。简而言之,深度学习是机器学习工具箱中众多方法的子集,主要使用人工神经网络,这类算法的灵感在某种程度上来自人类的大脑。
注意,机器学习虽然是当前实现人工智能的一种方案,但并不是唯一的方案。人工智能曾经经历过漫长的发展,曾经有很多算法都试图建立人工智能的框架,比如知识工程,符号主义等等。但这些算法目前都不是主流的,未来是否能够通过机器学习来趋近于通用的人工智能,仍然是未知的,这只是可能的一条道路而已。
在我看来,机器学习算法固然取得了极其巨大的进展。但其实并不符合智能的定义,它的很多算法其实就像巴普洛夫在训练他的宠物狗一样完成特定的任务获得特定的奖赏。通过目前的机器学习,我们最多能训练出类似宠物狗一样的机器人。但是人类智能中的推理、逻辑和借鉴仍然是遥不可及的目标。
在理解学习算法之前,我们需要首先知道算法领域里的两大算法框架。老子说,“万物负阴而抱阳,冲气以为和。” 算法领域的阴阳就是“贪心”和“退火”算法。任何算法都可以用这两种算法来构建出来。
所谓“贪心”算法,就是指的寻找局部最优解的算法。
所谓“退火”算法,就是跳出局部最优解的算法。
在大部分的过程中使用贪心算法,而在合适的时机使用退火算法,就能够构造出比较稳健的算法。
2.2 什么是机器学习?
亚瑟 . 塞缪尔这样定义机器学习:
使计算机不需要显式编程就能拥有学习能力的研究领域。
既然深度学习是机器学习的一个子集,那么什么是机器学习呢?一般来说,机器学习是计算机科学的一个分支,在这个领域里,机器能够学习执行那些没有被显式编程的任务。简而言之,机器观察某项任务中存在的模式,并试图以某种直接或者间接的方式模仿它。
我提到的直接的和间接的模仿,可以类比两种机器学习的主要类型:有监督的和无监督的。有监督的机器学习可以直接模仿两个数据集之间的模式。它总是尝试获取一个输入数据集并将其转换为对应的输出数据集。这有时是一项非常强大和有用的功能。不妨考虑以下示例(黑体代表输入数据集,斜体代表输出数据集):
- 使用图像的像素来检测猫存在与否
- 使用你喜欢的电影来预测你可能喜欢的电影
- 使用人们所说的话来预测他们是高兴还是难过
- 使用天气传感器数据来预测下雨的概率
- 使用汽车发动机传感器预测最佳调节设置
- 使用新闻数据预测明天的股价
- 使用输入的数字预测其两倍规模的值
-使用原始音频文件预测音频的文本
这些都是有监督的机器学习任务。在以上所有案例中,机器学习算法都试图以某种方式来模拟两个数据集之间存在的模式,从而做到用一个数据集预测另一个数据集。对于这些示例中的任何一个来说,都不妨想象一下,如果我们能够在仅仅给定输入数据集的情况下就预测出输出数据集,这样的能力将会影响深远。