【笔记】PyImageResearch-DL4CV阅读笔记-3

2018-07-14 本文已影响28人曦沉

20180714：pyimageresearch的DeepLearning for ComputerVision电子书阅读笔记。

封面

Chapter 4： Image Classification Basics图像分类基础

这一章节作者主要讲述了图像分类的一般方法和深度学习方法在图像分类中的应用。

简单来说，图像分类就是给图像赋予一个预先定义好的集合中的标签。也就是说，输入是一张图像，输出是一个标签。
假设一个标签集合：

categories = { cat, dog, panda }

我们输入一张如下的图片

待分类图片
我们的目标是通过分类系统得到标签dog
并且分类系统还应该有能力提供每个标签的概率：dog: 95%，cat: 4%，panda: 1%

通常的深度学习任务中都会使用到数据集，数据集(Dataset)中的每个数据叫做数据点(Data point)，例如一个带有标签的图片数据集，任何一张图片数据集中的图片叫做数据点。

深度学习图像分类任务中图像因素的难点：

图像因素举例

作者提到，学习深度学习图像分类的过程应该从简单的分类开始，也就是分类具体化，比如一个场景中，如果目标定位识别场景中所有的物体，那么可能系统的难度会很高。如果简单的定义为识别场景中的汽车，那么系统的复杂度就会低很多，也会准确很多。

深度学习类型：

本书中使用的是监督学习

通常的监督学习包包含

深度学习的四个步骤：

特征学习和深度学习在图像分类上的对比
特征学习需要在训练网络之前做特征抽取，CNN深度学习则不需要，直接提供图像像素的原始数据。

如果预测结果不正确该怎么办？
深度学习模型预测结果不理想叫做泛化问题(generalization)，通过调节参数等方法来纠正。具体方法这章节没有具体说明步骤和思路。