计算机视觉发展

2020-09-11  本文已影响0人  Alfie20

1. 概览

1.1 定义及历史

1.2 计算机视觉 vs人工智能

人工智能范畴 计算机视觉知识树

1.3 整体概览

2. 计算机视觉进展

2.1 图像分类

2.1.1 发展历程
网络越深,精度越高 轻量化网络,ShuffleNet-V2,准确性和效率均最好
2.1.2 挑战

人识别一个物体特别简单,但是计算机处理起来却不是件容易的事,需要应对多方面的因素变化

2.1.3 典型框架

深度学习成为主流之后,网络设计的思路:网络加深、网络加宽,为了提高效率,网络也向轻量化发展。

2.2 物体检测

2.2.1 发展历程

2.2.2 挑战

平衡两方面因素

2.2.3 典型框架
2.2.4 发展趋势

物体检测的发展趋势:Anchor-Free、关系推理、弱监督检测和轻量化

2.3 图像分割

2.3.1 定义


语义分割
实例分割
3D分割
视频分割

2.3.2 分割质量评价指标

2.3.3 发展历程

2.3.4 典型算法

2.3.5 挑战

2.3.6 数据集

2.3 视频分析

2.3.1 发展历程

2.3.2 典型算法

2.3.3 挑战

2.3.4 相关数据集



2.4 SLAM

2.4.1 知识树

2.4.2 经典算法

2.4.3 发展趋势

2.5 人机交互

2.5.1 定义

视觉感知是人机交互的一个重要手段,如人脸、眼球、手势、体控等多种探测与交互的应用。在这些应用中,视觉产品扮演着计算机输入设备的作用。


人脸交互 表情识别/眼球追踪/头部姿态
手势交互
体控交互

2.5.2 面部表情

2.5.2 手势

2.5.3 人体

2.6 OCR & STR

OCR 光学字符识别,起源于上世纪50年代,如今技术成熟。STR自然场景文本识别,尽管有深度学习加成,仍是热点与难点问题

2.6.1 发展历程

2.6.2 定义


文本检测
SWT:基于笔画特征
MSER:基于稳定区域
FCN+RNN:基于分割的方式
SSD-based:基于深度检测的方式
文本识别
字符识别:HOG、SIFT特征
单词识别:CNN分类
文本行识别:CNN + LSTM + CTC

2.6.3 挑战与难点


多种语言文本混合
文本方向多样性
文字变形(透视、仿射变换)、残缺、模糊等现象
自然场景图像的背景极其多样
光照变化、遮挡问题

2.6.4 发展趋势

2.7 机器学习

2.7.1 定义

机器学习为计算机视觉提供了理论与方法基石,同时,新兴方向已经正在影响并有可能引领视觉应用的未来
对抗生成学习 GANs
强化学习
Automl


2.7.2 生成对抗网络

深度卷积网络与博弈论的结合诞生了GANs

2.7.3 强化学习

研究学习器在与环境的交互过程中,如何学习到一种行为策略,以最大化得到的累积奖赏


2.7.4 Automl

上一篇下一篇

猜你喜欢

热点阅读