CS231n学习笔记--计算机视觉历史回顾与介绍1
CS231n简介
首先我们来看看官方对这门课的介绍:
计算机视觉在社会中已经逐渐普及,并广泛运用于搜索检索、图像理解、手机应用、地图导航、医疗制药、无人机和无人驾驶汽车等领域。而这些应用的核心技术就是图像分类、图像定位和图像探测等视觉识别任务。近期神经网络(也就是“深度学习”)方法上的进展极大地提升了这些代表当前发展水平的视觉识别系统的性能。
本课程将深入讲解深度学习框架的细节问题,聚焦面向视觉识别任务(尤其是图像分类任务)的端到端学习模型。在10周的课程中,学生们将会学习如何实现、训练和调试他们自己的神经网络,并建立起对计算机视觉领域的前沿研究方向的细节理解。最终的作业将包括训练一个有几百万参数的卷积神经网络,并将其应用到最大的图像分类数据库(ImageNet)上。我们将会聚焦于教授如何确定图像识别问题,学习算法(比如反向传播算法),对网络的训练和精细调整(fine-tuning)中的工程实践技巧,指导学生动手完成课程作业和最终的课程项目。本课程的大部分背景知识和素材都来源于ImageNet Challenge竞赛。
前置课程
CS131是CS231n的非必需前置课程,如果对于计算机视觉一无所知,可以先学习这门课程
计算机视觉历史
这里我们列出了计算机视觉发展史上重要事件
寒武纪大爆发
五亿四千万年前,生物还没有进化,物种也很单一,还只是单纯的浮在水面上,张开嘴,等着食物自己送上门来。但突然有一天,物种大爆发,出现了各种各样的生物,原因是什么呢?比较令人信服的说法是生物有了眼睛,有了眼睛之后,生物捕食就开始变得有目的性,而不是盲目的等着食物自己漂浮到嘴里。这样,生物之间就展开了“装备竞赛”,以此视觉能力的出现是生物大爆发的主要驱动力。
达芬奇“照相暗盒”
在文艺复兴之前,有很多照相机的模型,但是如果你去了解第一份描述现代照相机原理的资料,你会找到“照相暗盒”,是由达芬奇描述的。它用一个镜头(小孔)来捕捉真实世界的光线,这就是现代视觉工程技术的开端。
局部感受野
1962年,Hubel和Wiesel等通过对猫的大脑视觉皮层系统的研究,提出了感受野的概念,并进一步发现了视觉皮层通路中对于信息的分层处理机制,由此获得了诺贝尔生理学或医学奖。