【笔记】PyImageResearch-DL4CV阅读笔记-3
2018-07-14 本文已影响28人
曦沉
20180714:pyimageresearch的DeepLearning for ComputerVision电子书阅读笔记。
封面Chapter 4: Image Classification Basics图像分类基础
这一章节作者主要讲述了图像分类的一般方法和深度学习方法在图像分类中的应用。
简单来说,图像分类就是给图像赋予一个预先定义好的集合中的标签。也就是说,输入是一张图像,输出是一个标签。
假设一个标签集合:
categories = { cat, dog, panda }
我们输入一张如下的图片
我们的目标是通过分类系统得到标签
dog
并且分类系统还应该有能力提供每个标签的概率:
dog: 95%
,cat: 4%
,panda: 1%
通常的深度学习任务中都会使用到数据集,数据集(Dataset)中的每个数据叫做数据点(Data point),例如一个带有标签的图片数据集,任何一张图片数据集中的图片叫做数据点。
深度学习图像分类任务中图像因素的难点:
- viewpoint variation 视点变化
- scale variation 图像尺度变化
- deformation 图像形变
- occlusions 图像遮挡
- illumination 图像光照强度变化
- backgound clutter 图像的复杂背景
- intra-class variation 图像复杂类型变化
作者提到,学习深度学习图像分类的过程应该从简单的分类开始,也就是分类具体化,比如一个场景中,如果目标定位识别场景中所有的物体,那么可能系统的难度会很高。如果简单的定义为识别场景中的汽车,那么系统的复杂度就会低很多,也会准确很多。
深度学习类型:
- supervised learning 监督学习
- unsupervised learning 无监督学习
- semi-supervised learning 半监督学习
本书中使用的是监督学习
通常的监督学习包包含
- Logistic Regression 逻辑回归
- Support Vector Machines SVM支持向量机
- Random Forests 随机森林
- Artificial Neural Networks 人工神经网络
深度学习的四个步骤:
- Gather your dataset 聚合数据集(每张图配有对应的标签)
- Split your dataset区分数据集为训练集和测试集
- Train network训练网络
- Evaluate评价
特征学习和深度学习在图像分类上的对比
特征学习需要在训练网络之前做特征抽取,CNN深度学习则不需要,直接提供图像像素的原始数据。
如果预测结果不正确该怎么办?
深度学习模型预测结果不理想叫做泛化问题(generalization),通过调节参数等方法来纠正。具体方法这章节没有具体说明步骤和思路。